|
論文
- このページは
- 論文の基本
- 論文の進め方順
- 論文を書く順序
- 論文とは・定義
- 誰に向けて書くのか
- 章立て
- 査読
- 再読
- 数
- 数について記述する
- 7原則
- GEE アプローチ(一般化、例示、例外)
- 因果関係と有意性
- 因果関係
- 統計的有意性
- 実質的有意性
- そのほかの原則
- ツール
- 定義
- 翻訳
- ツール
- 図
- 表
- 単位
- 例
- 英語
- 用語
- 参考文献・参考ウェブページ
- 履歴
論文の書き方について。日英混合。
論文や報告書を書くときに定型を作ったほうが内容に集中した文章が書ける。
論文の書き方は仕様書を書く際にも使える。
そのためのメモをまとめています。
ドラフト版です。
- 発想・発見
- 資料・文献の検索・調査
- 理論的考察・思考
- 実験
- 検討・考察
- プレゼン・論文執筆
- 主張を決める。
- 仮題を決める。
- 参考文献リストを作成する。
- 章立てを決める。
- 図・表・式を作成する。
- まとめを書く。
- バックグラウンド・モチベーションなど、導入部を書く。
-
-
事実(実験)・モデル(数式)・定量的考察に基づいた客観的事実を述べるもの。
客観的事実のない主観・憶測は書いてはならない。
専門家向けだけでは良くないが、万人向けに噛み砕く必要はない。
論文には以下の要素がある。論文をよく読み以下のことを意識したほうが良い。
- 有効性 availability
- 新規性 originality
- 信憑性 reliability
読者が納得できるように以下を意識する必要がある。
- 理解可能な知識があるか。
- 同じ問題意識をもてるか。
- 論文の道筋を理解できるか。
- 同じ手順で、同じ実験をし、同じ結果を得られるか。
- 充分な情報があるか。
- 考察・結果が納得できるか。
-
以下のような章立てにすると分かりやすい。
- タイトル
- アブストラクト
- モチベーションなど。はじめに。
- 対象について・バックグラウンド
- 対象事象の理論的検討
- 実験・考察
- まとめ
- 謝辞
- 参考文献
- 付録
同業者(reviewer)が審査し、論文内容と質を保証すること。
以下のような裁定をする。
- 採録 accept 公表可能
- 条件付採録 conditional 要修正
- 棄却 reject 修正しても公表不可
修正を要するもの(2ステージ査読)とはじめから判断をするもの(2ステージ査読)がある。
著者が査読者を知らない形式(single blind review)と、著者、査読者ともに名を知らない形式(double blind review)がある。
書き終わった後に時間をおいて再度見直すと新しい発見があることが多い。
大事な文章を出す前に時間を置いて推敲するとよい。
- 数は特定のトピックについて興味を引き出したり課題について討論する証拠を提供してくれる。
- 数は簡単明瞭に。筋道立てて。はじめに着想や命題をあげ、次にそのテーゼを支持する証拠を用意する。読者が証拠と関連付け可能な例や、その証拠と問題を関連付ける文章も必要。
- 記述の詳しさのレベルは想定される用途にそったものでなくてはならない。
- 文脈を定め読者になじみのない用語は定義する必要がある。
- 数字の意味、測定・計算された方法を理解し、文章に数量的な情報を選択、説明する。
- 正確な定量的な分析・明瞭な解説文の両立を目指す。
- 目的にあわせて書き方を変えること。
資料の提供か、仮説の検定か、何か。
資料の対象は誰か。小学生か、大人か、技術者か、誰かなのか。
- 数量を表現する基本ツールは文章・表・図。
- 課題に対し、提示した数がどう答えを出すのか、を読者が理解できるように記載すること。
話をうまく伝えるためには著者が文書に取り入れた事実を把握している必要がある。
目的を明確にし、数値を選択したらそれらの数の目的を読者に伝える。
文脈で数字を使うときには懸案事項に数を関連づけて説明すること。
提示した数字は
-
-
-
- 繰り返しのプロセス
途中でより効率のよい表現するグラフや表に気づくかもしれない。その場合には作業内容を変更する必要がある。
作図とは別のプロセスとして、複雑な作業に入る前に重要事項のポイントを明確にメモしておくこと。
時間の無駄を防げることにつながる。紙と鉛筆で下書きを作成することも有効。
- 数について記載することは一連の複合的な作業。
それぞれのプロセスは独立しているのではなく、影響しあっている。
視点を木と森と切り替えるように意識すること。
数について記載する時の作業
- 適切な数の策定
- パターンの識別、見つけ出し。
- 比較するものの計算
- 考察、整理。
- 図、表の整理。
- 文章を書く。
- 首尾一貫した全体像を作る。
- 数の表現に不慣れな場合には以下のような評価を受ける境遇に陥る。
- 数量に関する概念に不慣れ
- 執筆・デザインの技術がない。
- 対象読者・聴衆・目的にあわせて資料の調整ができない。
- 4つのwを明記し、提示する数についての文脈の確立。
- 誰がwho 、何をwhat、いつwhen 、どこでwhere したのか。
これらの要素がなければ読者は示す数の意味を解釈できない。
その場ではわかることがあっても時間と場所を変えて読まれたときに誤解を引き起こす要因になる。
- 自身がデータを選択するときにもこれらの要素がそろっていないデータは情報を調査するか、
選択しないことが望ましい。
- 数値には必ず単位をつけること。単位がなければ意味のないデータになる。
- 効果的な例示と類比の選択。
- 読者や聴衆が理解でき、親しみやすい簡単で身近な例を使う。
実際の状況に即した現実的な対比を選択する。
- 例は典型的なのか非典型的なのか、標準的なのか極端な事例なのかを明確にすること。
平均的な値との比較、差分の提示、ランキングなどを付記するとわかりやすさが増す。
- 例を選択するときは簡単性・妥当性を再優先すること。
読者の論理的・算術的思考を少なくすることが例と目的を理解しやすくなることにつながる。
- その他として適合性、比較可能性、読者・聴衆、測定など。
- 読者にあわせた語彙の選択
- 統計学の素養がある読者や聴衆が対象ならば用語を定義し関連分野の同義語を挙げる。
- 専門家でない読者や聴衆が相手の場合は専門用語や数学記号を日常的な言葉に置き換える。
例:運動であれば、ご飯茶碗何杯分。金額であれば缶ジュースやタバコの値段。
- 文章・表・図のどれをつかって数を提示するかを決定する。
- いくつの数が報告に必要とされているのか。それによって選択するツールが異なってくる。
少なければ表や図を使う必要はない。多ければ表や図が有効なツールになる。
- 読者や聴衆がこちらのデータを把握するための所要時間を予測すること。
時間がなければ要点のみの箇条書きにすること。
- 読者が正確な値を必要としているかどうかを判断すること。
正確な値が必要なら表で細かく数値を記載し、そうでなければ図で傾向を伝える。
図は一番わかりやすく、正確な値を読むには適さない。
- 原則として一つの情報を表と図の両方で重複させてはならない。
例外として傾向と詳細な値を両方伝える必要がある場合には、図を記載し、表を付録に記載する。
併記は煩雑で飽きられてしまう。
もう一つの例外として読者と聴衆のレベルが異なるとき。
専門の技術者に報告する場合に表を用い、一般的な説明には図を用いたりする。
- 文章中で数(データ)を報告し、数の解釈を述べること。
- 数を報告し、それらの数の目的を明確にする。
数だけを述べると数の解釈を読者に投げることになり、読み手は混乱する。
プレゼンテーションの最中では発表の妨げになりかねない。
- 数についての解釈を述べ、それらを本題に関連付ける。
そうすることは自分自身が数、データに対しての理解を深めることができるようになるいいきっかけになる。
積極的に、ただし簡潔におこなうべき。
このときに解釈だけにせず、必ず生のデータ群も記載すること。
著者の解釈の真偽性についての新たな疑問を呼び起こすことになる。
生のデータに対しての注意を呼び起こすための一例を示す、と考えるのがちょうど良いのかもしれない。
たとえば3割増、という記載だけではどの程度の数か、大小がわからないし、
その他の場所や時代との比較がその資料ではできない。
- 変数間の関連性の方向と大きさを明記する。
- 傾向についての場合は上昇傾向なのか、下降傾向なのかを明確にする。
- 異なるグループや場所間の相違についての場合は、どちらが高く、どれだけ高い値なのかを明確にする。
- 変数には正の関連性(直接関連性、ある値に付随して増える)と
負の関連性(逆の間接性、ある値に付随して減る)がある。
- 関連性の大きさ、方向を記載するときには、短い文と平易な語彙を使う。
- 仮説を立てるときには関連性の方向を述べるまでにしておく。
大きさについては明確な仮説は立ててはいけない。
あくまでも仮説は予測なので、あまり詳細な大きさの提示は真偽性に関わる。
- 多くの数が存在するパターンについて説明するにはすべての数を繰り返すのではなく、全体的なパターンを要約する。
- 大部分のデータに適する一般化を見つけ出す。
- 詳細にすべてのパターンを拾い上げると煩雑になる。詳細は繰り返さず大筋を述べる。
少ない数を任意に選択すると一般的なパターンを代表していないで文と形式で対照させてしまい、意味のない報告になる。
これらは読者に混乱をきたす。読者には全体的なパターンを説明し、興味があれば図や表を参照できるようにする。
- 関連する表や図から、実例となる数をいくつか取り上げ報告する。
一般的なパターンに対する例外を説明する。
- 数(データ)のパターンの説明を効果的に提示するためのGEEアプローチがある。
一般化、例示、例外(generalization, example, exceptions) を用いる。
はじめに一般的な言い回しで識別・説明し、代表的な例を挙げてそのパターンを描写する。
その後、例外があればそれを説明する。
- 一般化ではデータが上昇か、下降か、安定しているか、など、一つのデータを見たり、
複数データが常に同じ差や非を持っているのか、などをみて、
ほとんどのパターンに当てはまっているかパターン化する。
- 一般化は俯瞰で見ることを心がける。木ではなく森を見たほうが全体的なパターンを発見しやすい。
- 例示では一般化したわかりやすい言葉をつかって実際のデータを示す。
この作業をすることで読者は表や図に一般化のパターンを当てはめて考える。
論文に対する興味・理解をさそうことができる。
- 例外では、使用したすべてのバリエーションに適用できない部分を説明する。
一般化と例外の間にある大きさと方向を説明する。
例外について表や図から抜き出した数値による例示を使用して例外について説明すること。
例外は大きさと方向、両方について発生する。
- 表や図をつかったデータ表示
- 比較する次元の識別
次元を変更するときは一つずつ行うこと。
複数線を持った傾向図(トレンドチャート)などでは一本の線にそって左から右へグラフを見ることと、
線を垂直に移動して見ることができる。
三変量の表では列の内部で行をたてに移動したり、行の内部で列を横に移動して見ることができる。
- 代表例の選択
一般化のため代表例を選択するとよい。
- パターンの特徴づけ
自分で挙げた例の値をつかってパターンの大きさ・方向を述べ、
専門知識をもつ読者であれば統計的優位性についても述べる。
注釈は簡単のため、余白か別ページに記載すること。
特徴づけ
- 方向に対するパターン
- 平定(一定)、流動的
- 直線的(等差数列)、加速的、減速的
- 単調、方向の変化のあるパターン
- 大きさに対するパターン
1,2種類の定量比較を行う。単純な計算の場合、単位も含めて計算方法を記載。
流動の大きさを説明できるように説明的な言葉や言い回しを書きためておくこと。
- 急激、緩やか
- 明らかに大きい、微々たる変化
- 統計的優位性
表や図に注釈として記載。統計的優位性がない、ということも一般化になる。
統計的に優位なものが一部しか取れない場合には可能な範囲でパターンを要約できるように共通性を探す。
- 例外の識別
例外は方向、大きさ、統計的優位性の3つで発生する。
一に当てはまらない例と一般的な例をわけるために傾向ペン等で図や表にしるしをつけて解析する。
- 記述の説明
分析のパターンごとにGEEアプローチを使う。
- 数について記述する
数について記述することは、一般的に2つ以上の変数の間にある関係について説明すること。
関係の形式と大きさについて説明したあとは、関連性を解釈し、それが有意であるか、重要であるかを判断する。
統計用語と研究デザインの概念をここでは述べる。
- 研究で関連性について述べるとき、結果には示すべき3つの課題がある。それぞれ明確に記述すること。
- 因果関係
関連性とはただの議事的な相関関係か。根本に変数間の因果関係があるのか。
- 統計的有意性
その関連性は統計的に有意なのか。
- 実質的有意性
その関連性は実質的に有意なのか、実質的な意味を持っているのか。
- 仮定として上げた原因と、想定される結果を結びつけるメカニズムを説明する。
因果関係以外の説明を挙げてその利点と欠点を比較し、バイアスや交絡、逆の因果関係が発生する原因を識別する。
- 相関関係は必ずしも因果関係を表すわけではない。
因果関係、交絡、バイアス、偶発事態などの要因がある。
- 因果関係とは
明らかな原因(予測変数、独立変数)の変化に呼応して、
想定される結果(結果変数、従属変数)も変化する、ということ。
一つの変数がもう一つの変数に影響する、妥当なメカニズムを確立すれば、
因果関係を明示する事例を構築するのに役立つ。
当該のトピックに関する理論的な文脈と既存の根本的な知識を知っておく必要がある。
逆の因果関係とは、
原因と思われていたことが実は結果だった、という場合。
逆の因果関係を看破するためには時間的な順序(どちらが先に起こったか)を
考える。
- 交絡
2つの変数の関連性が、それぞれ第3の変数との間に相互関連性を持つ場合、
これら2つの変数の関係は第3の変数によって交絡されているという。
たとえば、白髪は黒髪よりも死亡率が高いのは年齢との関連性である。
交絡が発生しているかどいうかは理論的背景と経験が必要になる。
- バイアス
1つ以上の変数について、真の値に関連する定誤差(系統的な誤差)のこと。
真の値よりも高い、または低い場合がある確立的誤差があるときとは対象的に、
バイアスは測定値が常に一貫して同じ方向へ真の値から逸脱すること。
サンプリング(事例の選択)と測定(データ収集方法、客観的か主観的か)の
問題から発生する。
場合によって標本に重みをつける必要がある。
- 用語
関連性を示す用語の使い方に注意する。
- 因果関係を示す用語。
影響する。引き起こす。帰結。効果。
- 因果関係を示さない用語。
相関した。関連した。
- 因果関係の評価
- 関連性の一致性
目的の異なる母集団の間で観測される関連性
- 関連性の強さ
事例間の結果の差
- 関連の時間性
原因が結果に先行する。
同じ時期に測定した2変数の相関関係は弱い。
- メカニズム
原因が結果に影響を及ぼす妥当な手段が存在している。
- ある関係について記述する場合、
関連性が因果関係によるものかどうかどうかを伝える。
想定される因果関係のメカニズムについて説明する。
バイアスや交絡、逆の因果関係についても説明し、
それらが自分の統計分析でも考慮に入れているかどうかを示す。
因果関係でない場合には、観察された関連性の原因となった交絡、バイアス、
逆の因果関係を説明する。
- 因果関係の立証が困難な場合
ある条件について実験でまったく同じ結果を数種そろえることは困難。
どの事象、どの条件が最初に発生したのかを定めることが不可能なこともある。
測定されていない潜在的な交絡やバイアスが多数残っていることもある。
因果関係のパターンをうまく検証することができない研究デザインでは、
そうした弱点と、それらの弱点がなぜ因果関係を推測させるのかを指摘する。
- 統計的有意性
統計的有意性とは、観測される関連性が単なる偶然としか説明できそうにないのか
どうかを評価するための方法。
統計的有意性が欠如していることについて明記していない場合、
読者はレポートの事象の関連性を本物と解釈する。
関連性が因果関係としてすでに示されたことがある場合に起こりがちである。
- 結果の信頼度
消費者としての読者は、細々とした細部を見たいとは思っておらず、
適切な手順を正しく進めたことを保証することは売り手である執筆者にゆだねられている。
読者が研究者である場合には、自分が使用した手法の名前を挙げれば自分の作業の信頼度を挙げることができる。
自分の作業の信頼度を上げる例:iso の基準や、ieee の規格を用いたことなど。
統計学では、Moore(1997), Utts(1999), Miller(2005) などの論文を参照すること。
- 記載方法
統計的有意性については結果セクションで報告する。
P 値や信頼区間については実験本文で、それ以外の統計的検定の結果は表で言及する。
新しい意発見がある場合、理論や以前の研究と反している場合には、再び統計的有意性について議論する。
研究成果は言葉をつかって説明する。
専門家でない読者・聴衆に対しては数値による詳細な検査結果は報告しない。
- 統計的有意性を評価する、示す。
- 記述統計学を用いる。
- 平均値
- 中央値 median
- 最頻値 mode
- 範囲 range
- 推計統計学
- 差がないという仮定を帰無仮説という。
- 推計統計学では帰無仮説の元で観測される差や、
グループ間で大きな差が得られる可能性を評価する。
- もしも帰無仮説が真ならば、
現在の分析と同じくらいかそれを超える規模で偶然によってのみ
関連性が観測される可能性はどのくらいか、という疑問を提起して、
帰無仮説の否定を試みること。
t値 χ二乗値 といった検定統計値を予測値および標準誤差から算出する。
それから検定統計値を適切な統計分布と比較することでP値が得られる。
P値が低いほど帰無仮説を誤って否定する可能性が低くなる。
差が統計的に低いことを示すためにはP値が低い必要がある。
- 統計的有意性を満たすためにはP<0.05 である必要がある。
(P<0.05のルール)
この意味は帰無仮説が真の場合、
サンプル値以上の大きさを持つ差が観測されるサンプルの数が、
同じ母集団から抽出された100のサンプルのうち5つ(5%)未満であること。
もっと噛み砕けば、提起した規則に95%以上が関連性を示す、
ということが統計的有意性をしめすということか。
- サンプルサイズ・統計的検定
- サンプル(事例)数は関連する統計的検定の結果に影響を与える。
- サンプル数が大きいほど標準偏差が小さくなる。
- 信頼区間(CI)
95%の信頼区間(95% CI)は、
同じ母集団の100のサンプルから95のサンプルを抽出したときの
サンプルの平均値が実際の母集団の平均値における2つの標準誤差の間に
収まるような範囲を示す。
(厳密にいえば95%CIは標準誤差のプラスマイナス1.96倍だが
ほとんどの場合プラスマイナス2倍の既算値を使用すれば十分、簡単)
概念上、95%CIはP<0.05 に相当する。
- 統計的有意性は調査結果や読者聴衆、執筆物の長さに応じて変更すること。
- いくつかの因子を持つ統計の調査をしたときには
統計的に有意な差が出た特定の因子のみ重点的に論じる。
そうすることでどの因子(たとえば学区、クラスの人数、教師の経験)が
結果(たとえば数学の成績)を上げるのにもっとも役に立つか、
という主要な疑問に読者・聴衆が回答を導きやすくなる。
- 統計的に有意でない(グループ間に差がない)ことを示すためには
p値が0.05以上であることを示せばよい。
たとえば以前の理論と異なる理論を示す場合など。
新しい所見は理論上の予測と以前の研究の結果に明確に関連付けること。
- p=[0.06, 0.10] はグレーゾーンの範囲。
以下の因子を考慮して扱いを決める。
- 影響範囲
- サンプル規模
- 検定統計量の値
- 関連するP値
これらの因子は基準はなく、ケースバイケースで異なる。
グレーゾーンでサンプル値が小さい場合など標準誤差への影響がある事例であれば、
そのことを言及し、サンプルサイズによっては改善される可能性を明記すること。
逆にサンプル値が大きければ、
そのことには触れずに有意でない結果であることを述べればよい。
- 統計的有意性を記述する
- 専門的知識をもたない読者・聴衆であれば、専門的な概念に触れない。
- 専門的知識をもつ場合、統計的検定の結果(P値)を小数点2位以上で述べる。
- 議論セクション
- 数に関する記事・報告書では、発見された重要な事柄を議論セクションと結論セクションで要約し、
次にそれらを研究の論点に戻って関連付ける。
- 主な論点に関連した統計的に有意な結果と有意でない結果の両方が議論対象となる。
- あまり中心的でない事柄については言及を繰り返さないこと。
- 研究の結果を表現するには主な研究成果の規模や統計的有意性について
理論上期待される効果や以前の経験的な結果と比較する。
- 議論セクションでは概念や結論に関する統計的有意性を数値的な結果ではなく言葉で表現する。
- 他の研究と矛盾している結果が発生した原因として考えられる事柄を論じて全体像を完成させる。
たとえば実験日・場所・対象の特徴・データ収集の方法。
- あるトピックについてどれだけ知識があるかを確認するために、
統計的に有意な事柄だけを事実として論じること。
- 要旨と論点の概要として、論点に関連する主な論点に関連する問題を重点的に述べ、
統計的に有意な差だけを強調する。
- 統計的に有意でない差についてはその旨はっきりさせるか触れないこと。
- 統計的検定から得られた数値的な結果ではなく、言葉で説明すること。
- 実質的有意性
- 結果の差が小さくてもサンプルサイズが大きければ統計的有意性をもつ可能性がある。
差が小さい場合には以下のような証拠を用意する。
- その結果の差が将来の発展にどのようにつながるのか。
- その変化の価値を評価する、何らかの現実的な成果を得られるかどうか。
- 専門知識を持つ読者には寄与危険度計算(Lilienfeld and stolley 1994)や費用対効果分析(Gold 1996)、
総合的な影響について定量化する手法を結果セクションの最後に盛り込む。
- 専門知識のない読者、聴衆に対して上記の計算結果は議論セクションや結論セクションで取り上げる。
例:口語形式で語る。
Aの値が変化したことはBにつながる。
しかしBができてもAの変化では十分ではなく、AにはコストがCだけかかるため実質的な重要性は低い。
Dを選択したほうが、比べて得られる利益は大きい。
因果関係、統計的有意性、実質的有意性の間にある関係
- 議論セクションや結論セクションで研究性かを研究の主な論点に
関連付け、統計的有意性、因果関係、実質的有意性をまとめて検討する。
- 数の関連性の強さを結果として利用するためには、
関連性が因果関係を持つか、統計的有意性を持つのか、実質的有意性を持つのか、3つすべてが求められる。
述べるときには、各条件は簡潔にそれぞれ区別して述べること。
どれかが満たされても他の条件が満たされない可能性があることに気をつけること。
- 関連性が統計的に有意であることが、因果関係を持つことにはならない。
例:白髪と高い死亡率の相関関係があっても、それによって白髪が高い死亡率の原因にはならない。
- 因果関係があっても統計的有意性を示すことにはならない。
例:新しい勉強方法を取り入れることで成績があがる。(p<0.05 であっても確立的誤差やバイアスがある)。
- 統計的重要性があるといえても、実質的有意性(大きな影響)がない場合がある。
例:新しい勉強方法が効果的であってもテスト点数の上昇の度合いが小さい可能性がある。
- 実質的重要性がるといえても、統計的有意性がない場合がある。
例:有効な結果がえられたとしても、データ変動幅が広いことやサンプルサイズが小さいことで統計的には使えない。
- 因果関係があるということが即実質的重要性を持つということに結びつくわけではない。
例:新しい勉強方法でテストの点数があがる可能性があっても、
変化分が小さい場合にはその勉強方法に時間を掛ける価値がない場合がある。
- 白髪の例のように実質的重要性があることが、因果関係に結びつくわけではない。
-
- その他の追加の基本原則
計算方法、表、図、の正しい選択や比較して適切な数値を選択するときの準備。
測定の精度と容易なコミュニケーションのため。
- 変数の種類を理解する
- 単位を指定する
- 変数の分布を調査する
- 自分のデータを比較する対象となる基準を見つける
- 整数と小数点以下の桁数を正しく決定する
- 変数の種類の理解
- 対象の変数について理解する。
- カテゴリ変数か。そうならば名義変数か順序変数か。
連続型変数か。そうならば比変数か、間隔変数か。
ただし変数の種類は一つだけとは限らない。
- カテゴリ変数
- 順序変数
カテゴリがある。カテゴリに応じて順序をつけることができる。
例)国語のテストの評価:優
- 名義変数
カテゴリによる順位付けの存在しない名前つきの変数。
例)性別、人種、宗教
- 連続型変数
- 比変数
引き算と割り算、両方ともつかって比較が可能。0を想定される最低値として使用可能であるため。
例)距離。東京から名古屋までの距離と沖縄までの距離を比較するときなど。
- 間隔変数
引き算をつかって絶対差を算出し、比較ができる。割り算をつかっての相対差は計算できない。
例)気温30度は気温15度の2倍暑いとはいえない。
- 連続型変数をカテゴリ変数化すると、年齢であれば定年や成人のようなカットオフ(しきい値)の上か下かをあらわすのに役に立つ。
カテゴリ変数のカテゴリ作成には、考えの及ぶ範囲で相互排他的(重複がない)であることと、包括的(考えられるすべての回答を含んでいる)必要がある。
例)年齢は数字なら条件を満たせるが人種などはハーフなどがいるために相互排他的にすることがむずかしい。(複数のチェックをつけられるようにしなくてはならない。)
そういった場合には”その他”というカテゴリを作るとカテゴリの不足による情報の収集ミスを防ぎやすい(将来的に改善の可能性が残せる)
- 回答は一つだけか複数か。
択一選択式のすべての回答の合計は100%になるが、複数回等式では0-数百%のオーダを考える。
- その他のカテゴリ変数をカバーする事項
欠損値
不明やなし、というカテゴリを作成し該当しない場合のカテゴリも作るとすべての事例をカバーしやすい。
非適用
当てはまらないときのためのカテゴリ。
- 単位の指定
- 変数の尺度を知る。
- 集約のレベル、または分析の単位を明示する。
混乱を避けるために集約のレベルを数といっしょに説明する。
例) あるチェーン点は関東地方で30の支店を設立した。
- スケール、大きさの規模。
特にグラフやなじみのない単位からの移行時には注意。
文章に観測の単位と尺度を含めること。
- 測定体系(メートル法か、ヤードポンド法か)
自分にとってあたりまえの単位であっても読者・聴衆によってはなじみがなく、誤解を招く可能性があるため、必要に応じてあらかじめ用語を定義しておくこと。
例)火星探査機(mars climate orbiter, 1999)はメートル法とポンドヤード法の単位を混同して目標から100km ずれて失敗した。
説明が不足しがちが注意すべき事項
- 全体の中の特定の部分(2つの数量の間の関係)
- 2つのグループの相対的な大きさ(大きさの比率)
~のうち、~一つあたり、~に比べ、などの数字の解釈を促す語句を盛り込む。
- 自分の執筆物と他社の執筆物における比較可能性をチェックする。
- 比の扱いについて。
割合とパーセンテージ表示の区別には気をつける。
パーセンテージは対象を明記すること。また、どのサブグループをどの全体とひかくするのか、を気をつける。
例)ある年代の既婚率と前年代の既婚率
- 変数の分布の調査
- 典型値と比定型値、あるは対象を識別するために変数の分布を調査する。
- 助けになる値
- 基本事項
はじめに考える面
- 最小
- 最大
- 範囲(最小と最大の差)
2番目に考える面:中心傾向
- 平均値(average)
- 中央値(median)
- 最頻値(mode)
- 標準偏差(SD, Standard Deviation)
平均値がいっしょでもばらつきの種類が多数存在する。
- 正規分布(釣鐘型)
- 正規分布(なだらかな山型)
- 一様分布(すべて同じ値)
- 編曲二峰性分布(平均に近い値がなく、高いか、低いか極端な値のみ)
- 非対称な分布
ばらつきは標準偏差か分さんで集計する。
-
- 標準との比較
- 標準との比較は以下に使える便利な方法。
- 特定の値が一般的なのか、例外的なのかを判断すること。
- 観測されたパターンが典型的か、以上なのかを判断する。
- 標準には最大、最小値を観測するためのカットオフ(しきい値)、パターン、記録がある。
たとえば水が凍る温度の0度や過半数の50%がカットオフになる。
- 標準は所定の値、値のパターンを評価するために使用する。
適正な物理現象や社会現象の情報を標準と比較する。この比較によって根底のパターンを見つけやすくし、観測値が低いか高いか平均的かを確認することを助ける。
- 読者や聴衆が専門家でない場合、標準の使用は裏方的な作業になる。
結論だけをしめし、そこにいたるまでの過程は報告しない。
例:標準値はXである。
一方専門家が対象である場合、どの標準を使用したのか明確にすること。
新しいアプローチ、特異なアプローチをつかった場合には、方法・説明・参考文献を脚注や付録に盛り込むこと。
. -
- 適切な整数の桁数と小数点以下の桁数の選択
- 最初にデータを記録したときの精度と執筆物にそった精度を選択する。
桁数が大きくなりすぎると扱いにくく、データの精度を誇張しすぎることになる。
桁数が少なくなりすぎると読者の目的にそぐわなくなる。
- 測定の精度は報告可能な詳細情報のレベルによって制限される。
計算を報告するときに使う小数点以下の桁数は、測定精度と絶対に矛盾してはいけない。
例:ミリ単位の定規であれば、報告できる精度は0.01 cm まで。
参考:Logan(1995)
- ほとんどの場合、詳しくなりすぎずに要点を示すには2-4桁あれば充分。
3桁程度が見やすく、わかりやすく、使いやすい。
- 小数点以下の桁数は自分が扱う数の規模に適する範囲で最小に抑える。
1.0 よりも小さな数については変動を明らかにできるように、小数点以下の桁数が2つは必要。
- 表で小数点の桁数が多いのはなるべくやめること。
読者を圧倒する意味以外持たない。無意味。
- 数の規模にあわせて整数と小数点以下の桁数を選び、合計の桁数は文章で4桁、表で6桁を超えないようにすること。
桁数は可能であれば少ないほうがよい。
例外としては公共の標準的なデータソースやわざと際立った一つの数を目立たせるための計略的統計など。
- 桁を減らすには数のスケールを変えること。
最高値と最低値を考え、3,4桁で済むようなスケールを選ぶ。
例:百万人単位。マイクログラム単位。
その他科学表記をつかった記載法でも良い。
例:2.3 x 10^(-6) g (2.3 マイクログラム)
- 読者は表の桁数や選択したグラフの種類には興味がない。
なぜそのツールを選択したのかはふれて本題に関係のない余計な興味を引き出さないこと。
ツールで結果のみを示すこと。
-
用語を定義し、専門用語の使いすぎに気をつけること。
- なじみのない用語、複数の意味を持つ用語など。
- 括弧書きの注釈をいれる場合でも文章の流れを中断することに気をつけること。
- 読者にとって専門用語を示す必要があるのかどうかよく考慮すること。
たとえば家を購入するときに家を作る専門的な大工の道具の名前を覚えておく必要はない。
専門用語を頻繁に使用したい欲望に駆られたとき、
聡明で有能な書き手は複雑な概念をわかりやすく説明できるから聡明で有能であるということを思い出すこと。
数量に関して熟練した読者や聴衆を相手にする場合でも数値に関する複雑な関係を入念に説明することで、
自分がその概念に精通していることをアピールできる上、
読者や聴衆の中で恥ずかしくて説明を求めることができなかった人を理解に導くことができる。
- 短い文章での専門用語の使用は、再び使用しない用語の定義になりがちであり、無意味であることがある。
また読者に対して数学の不安感を呼び起こす可能性がある。
新しい用語を使用するということは、新しい用語を定義する必要がでてきてしまい、論文の要点からそれてしまう。
より直感的な概念に置き換えること。
- どうしても用語を定義しなければならない場合新しい語を使用したあとには必ずその定義を記載するか、
一般的に使われている用語に置き換えて説明し、その用語の意味と解釈を明確にする。
- 専門用語を使うべき局面もある。
同業者間での話し合いの時には一般名称よりも専門用語を用いたほうが意味が伝わりやすく重要な情報も伝わる。
自分の論文を審査に出すような場合には、専門用語を目立たせて使うことで精通していることを強調することができる。
注意するべきなのは導入部分や結論部では明確になるようにわかりやすい言葉に置き換えること。
方法論や分析のセクションには専門用語を記載しても支障がない。
分析のセクションで専門用語を使用することは読者を分析のセクションに引き込む良いきっかけになり、
結論のセクションで一般的な言い回しにすることで現実世界へ意識を引き戻し、より結論をわかりやすくする。
論文を翻訳するときのtips。
- 英訳する必要がある論文を書く場合、
充分にわかりやすいものであれば、
グラフは英語で作成してしまうと日本語の論文と図を共用できて楽になる。
- 英訳する必要がある論文を書く場合、
グラフや図はシンボル情報を使うと手間が省ける。
しかし、読みやすさが損なわれないようによく注意すること。
- 執筆者が一人ではない論文を書く場合、
グラフ等の本文以外の素材は編集可能なデータを準備しておくこと。
-
-
-
-
- 本文中の数字の単位は2,3桁にすること。
多数の桁が必要な場合はべき乗表現、科学単位の使用を考慮したうえで選択すること。
-
-
-
Title
kgussan@gmail.com
2006/11/12 TOKYO, Nerima
My Lab. My Inc.
|
|
When using SOMETHING, SOMETHING happens.
This is a report of my findings together with suggestions for possible workarounds.
This study was motivated by SOMETHING concerning SOMETHING.
XXX is XXX.
Because XXX is XXX.
XXX
|
-
-
-
-
|
|