経営学部で企業金融論や経営統計を担当している木下です。
学期末には定期試験とその後の成績評価がありますが、試験や課題を作るときに(統計学を理解している)教員が何を考えているのか、をお話します。
理想的な成績評価とは、極めて優秀な学生、優秀な学生、そうではない学生をまんべんなく見分けがつけられるようなものです。そのため、難しい問題から簡単な問題を広く出題することになります。平均値、標準偏差、四分位点といった統計学のツールを使ってこれらをコントロールしているわけです(しようとしているが、完ぺきにはできない)。
また、時間制限のある定期試験だけではその日の調子次第でミスをすることもありますし、時間をかければ正しく解答できる能力と、時間制限内に速く解答できる能力の両方を評価する必要があるでしょう。そこで、日々の課題と期末試験の両方で成績評価を行うのです。
平たく言えば、学生の学習成果が適切に反映されるような試験と評価方法を教員は考えているのです。成績評価を行った後に、100点の学生と0点の学生だけになってしまったら、それは学生の潜在的な学習成果を抽出するような試験にはなっていない、と考えられます。
ですが、一見いびつに見えてもそれが望ましい結果である可能性はあります。その理屈を後述します。
言うまでもないことですが、成績評価の分布以外の観点から重要な懸念事項があります。それは大学で学んだことや試験で出題された問題が、実社会において本当に有益な内容になっているかどうか、です。どのような能力が現代社会において有用なのか、ということは正確なところは誰も分かりません。実際に社会で生み出された価値を観測できれば、学習効果を測定できますが、そんなデータの収集は困難ですし、社会は変化しますから、再現性のある測定は不可能に近いものです。
データ分析においては、トレーニング用のデータとテスト用のデータを別で用意しなければ再現性に関して信憑性が薄れてしまう、という話があります。トレーニング用のデータに当てはまるようにモデルを作ったとしても、それは過剰当てはめの可能性があるのです。一方で、トレーニング用のデータとテスト用のデータに分けてしまうと、トレーニングに使えるデータが少なくなってしまってもったいないという見方もできます。そのため再現性とトレーニング効率にはトレードオフ(一方を重視するともう一方を犠牲にする)があるのです。これは理論上必ず生じるもので、統計学ではその調整方法が日々研究されています。
大学では、担当教員が授業内容を決定し、成績評価もその教員が行います。これは上記のデータ分析と同様の観点から考えると、特定の教員の授業内容に対する過学習が生じていて、それを評価している可能性があります。したがって、再現性という観点からは望ましいものとはいえないかもしれません。
さて、では何故このような方法が採用されているのか、を考えてみましょう。これは極めて簡単な理屈で、専門家である教員こそが授業内容と評価方法の両方に関して精通していると考えられるから、です。
ある試験において、ある問題の正答率がゼロだったとしましょう。これは、教員の作問や授業が悪いのかもしれませんし、学生の理解が悪いのかもしれません。
このときに、教員と学生のどちらが実社会に関する情報を持っているか、という観点に立つと、やはり教員の判断を重視することになるでしょう。では、授業を行う教員と試験を行う教員を別にする、という案はどうでしょうか。これにはやはり再現性とトレーニング効率のトレードオフ問題があります。これらの総合的な観点から、現状の大学ではトレーニング効率と教員の専門性が重視されて、担当教員に一任する、という方法が受け入れられていると考えられます。
学生から見ても、他の教員から見ても何が重要なのか分からない、専門性の高い(高いように見える)分野であるほど、教員が好き勝手できてしまう、という問題が生じてきますが、その話は専門家に譲ることにします。
制約のある問題では必ずトレードオフの問題が生じます。例えば、80点以上を合格、と決めてしまうと優秀な学生だけを採用できる一方で、採用できる人数が減少したり、不安定になったりします。また、数学の配点を上昇させると、それ以外の科目を相対的に軽視することになります。上述のような、授業と成績評価における再現性とトレーニング効率のトレードオフがあるように、最終的には上手くバランスをとるための程度問題の評価が重要になります。
こういったロジックは、有限の予算における投資における企業選択、企業の従業員の採用活動等においても同様に使うことができます。
このような様々な対象に関する評価方法、その裏側にある(損得に関する)人間行動のメカニズム、情報のやり取り、意思決定のロジックを学ぶのが経営学部の一連のカリキュラムです。身近なテーマの延長線上にあるロジックですが、落とし穴に落ちないための思考の訓練や、程度問題を適切に評価するための技術の習得によって様々な意思決定を有利に進めることができるのです。
木下 亮