ぶんぶんの進路歳時記

学習方法、進路選択、世界史の話題について綴ります

高校入試気になるニュース(都立高校入試でスピーキングテスト?! 2022年5月)

 当ブログは大学入試がメインですが、今回は東京都の公立高校入試の話題です。

 「地方都市の教員が東京都に意見するな!」と言われそうなので、以下にぶんぶんの考えを挙げ、これをもとに問題点を整理します。

  • 入試には複数の形式があってもいいが、各形式の中では公平性や公正性が担保されるべき
  • 公平性や公正性を確保するために入試は「性悪説」で行われるべき
  • 学習に投資するのは個人の自由だが、公的な入試のうち最も定員が大きいものは保護者の経済的状況になるべく左右されない制度であるべき
  • 民間企業が教材を作ったり検定を実施するのは自由だが、彼らを公的な入試に参入させると利益相反の疑念は避けられない
  • 「入試を変えれば教育が変わる」は論理の飛躍
  • 理念が制度に落とし込めない改革は速やかに撤退すべき

目次

 

1 東京都の都立高校入試でスピーキングテストを点数化

Tokyo Portal for International Education 〈国際教育・東京ポータル〉

www.tokyo-portal-edu.metro.tokyo.lg.jp

 このスピーキングテストの目的 引用A

(1)小・中・高校における一貫した英語教育の推進により、生徒の「使える英語力」の育成を目指します。

(2)中学校における学習により身に付けた「話すこと」の力を客観的に評価し、中学校と高校における英語指導の充実及び円滑な接続を目指します。

 「中学校英語スピーキングテスト」(以下ESAT-J)は建前上「アチーブメントテスト」です。ただし2022年度に都内公立中学校3年生全員がこれを受け、その結果を都立高校入試に活用する予定なので、実態は「入試」です。

 都教委は株式会社ベネッセコーポレーションと協定を結び、事業主体は都教委、運営主体はベネッセコーポレーション(の子会社「学力評価研究機構」)です。

 これ?

www.nikkan-gendai.com

 実施日は2022年11月27日で、都立学校、民間施設等が会場です。7月上旬からWEBによる申込みがはじまり、テスト結果の受け取りは2023年1月中旬になります。

 その結果が以下のように都立高校入試に活用されます。

引用B

https://www.kyoiku.metro.tokyo.lg.jp/press/press_release/2021/files/release20210924_03/bessi.pdf 

  • 調査書には段階別評価(A~F)が記載される。
  • A=20点、B=16点、C=12点、D=8点、E=4点、F=0点と点数換算
  • 都立高等学校では、学力検査の得点(500点満点を700点に換算)と調査書点(5教科×5+4教科×10=65点を300点換算)の合計(1000点満点)にESAT-Jの点数を加え、総合得点(1020点満点)を算出する(第一次募集・分割前期募集)
  • ESAT-Jを受験していない生徒は筆記試験の点数から見込み点を算出する

 

(゚Д゚)ハァ?

 

2 どこが問題?

① ESAT-Jの問題点

1)アチーブメントテスト?

 都教委は「中学校と高校における英語指導の充実及び円滑な接続を目指します」と説明していますが、ESAT-Jの結果で調査書に記載されるのは6段階のグレードのみです。

 ESAT-JはパートAからパートDの4ブロックからなり、それぞれ順に「英文を読み上げる」「質問聞いて応答する/意図を伝える」「ストーリーを英語で話す」「自分の意見を述べる」という形式です。得点は以下の通りです。

パートA 発音3×2=6

パートB 達成度1×4=4

パートC 達成度1 表現・論理性4 発音3=8

パートD 達成度1 表現・論理性4 発音3=8

合計26点

 これがIRT(項目応答理論)により採点結果を統計的に処理して0~100点に点数化した上で6グレードに振り分け(後述)、さらにそれを点数化します。

 ただし生徒に返却される「今回の結果」にはスコアが数値で、「ESAT-J GRADE(評価)」がA~Fの6段階で表示されているだけで、テストの設問の4パターンのそれぞれの「タスクの達成度」はわかりません

 またスコアレポートには各受験者用にcan-do statementsが載っているのですが、同じくスコアレポートに載っていて各レベルの一般的達成度を示す「ESAT-J GRADE Can-Do Statements」と一言一句変わりないそうです。bot

 

参考 資料1 東洋経済 大津 由紀雄さん

toyokeizai.net

 2022年3月30日(水)文部科学省記者クラブで開催された「入試改革を考える会」の記者会見で、松井孝志さんは「テストの設問の4パターンのそれぞれで『タスクの達成度』も分からず、『使用できる語彙表現の多様性』も分からず、『音声の特徴や流暢さ』も分からない中で、どのように『スピーキング力』の指標として入学後の指導に活かせるのか」と疑問視しています。

 生徒は「次はここを強化しよう」というフィードバックもできず、高校もグレードだけもらっても使いようがありません。

資料2 松井さんのブログ

tmrowing.hatenablog.com

 AERAが「生徒から成績に対する不服申し立てがあった場合、都は得点開示などの対応をするのか」と確認したところ「得点開示は成績票がすべて。これ以上のものを渡すことは難しい」との回答です。

 またEduAの「中学三年生の1月中旬に結果が返ってきてフィードバックできるのか。受験準備の最中ではないか」との質問に都教委は「まだ2ヶ月あります。入試が学校教育のすべてではありません」と、入試を前提とした制度設計とは矛盾する答弁です。

 入試がすべてではないのなら、入試に活用する以前にパート別得点とひとりひとりへの丁寧な学習アドバイスをつけて生徒に返却すればいいのに、なぜしない?

*2022年5月28日のツイデモでアップされた「taka1984」さんの開示請求資料を読むと、議論は「入試にスピーキングテスト」が先で、内申は後から出てきたことがわかります。

資料3 AERA

dot.asahi.com

資料4 EduA

www.asahi.com

2)ブラックボックス

 8万人規模かつ1点で合否が決する公立高校の試験に使うのであれば、「誰が、どのように、どういう根拠で採点するか」が受験生に明示されて当然です。

 高校入試については問題・正解例・配点が公開されていますし、採点者は当該校の教員、開示請求をすれば自分の答案を閲覧することも可能です。

 都議会などでも採点態勢について何度か質問がありましたが、都教委は一貫して「企業秘密に関わる」として回答していません。

資料4EduAより。引用C

問:ESAT-Jの採点者が、ベネッセのGTECやオンラインスピーキング講座のフィリピンのスタッフとは重複していないかを都教委は確認していますか。

答:ESAT-Jの採点者は、ベネッセの責任において運営されているフィリピンの採点センターの常勤スタッフで、スピーキングテストの採点を行う専任であることを確認しています。採点者はESAT-Jに専従してもらいます。採点者は、ESAT-Jの専門の研修を受けており、採点の「癖」や「ぶれ」は出ないようにしています。

問:専門家は、①解答の一部を都教委が採点して業者の採点と一致するかを点検したり、②ダミーの解答を紛れさせて採点の質を確認したりする、などして、公平、公正な採点ができているか、都教委が確認する必要があると言っています。

答:都教委は、採点がぶれないためのガイドラインの作成に関与し、採点に関する研修や採点結果をチェックする態勢など、公平・公正な採点ができる態勢であることを確認しています。採点品質を担保するノウハウに関わる部分については答えられません。採点については、都教委が全て把握し、監督しています。安心して下さい。 

問:英語の作問に関わっている専門家はどなたでしょうか。ESAT-Jの内容がGTECと酷似していることについて、専門家はどのように判断しているのでしょうか。

答:個人名は公表できません。ESAT-Jについては、都教委として責任を持ってやっている、ということです。

 都教委として責任を持って実施しているが、中身はベネッセコーポレーションがやっているので企業秘密だから教えられないということです。

*フィリピンは知り合いがやっている英語塾の本体が留学村を運営するなど、日本向け英語学習の拠点です。フィリピンという場所ではなく採点体制(別の検定の採点と同じラインで採点されるとその検定を受けている人が有利になる)が問題です。

 また松井孝志さんは、下の表のBとCはどう優劣をつけるのか、その優劣をつける根拠は何かと疑問を投げかけています。

  母語話者に遠い:言い淀み、言い直し 母語話者に近い:流暢度が高い
限られた語彙表現、文構造 A B
多様な語彙表現、文構造 C D

 都教委は「企業秘密」の一点張りですが、松井さんは「ESAT-JとそっくりのGTECでは公開されているから秘密ではないだろう」と主張します。 

 入試は詳細が公開されるからこそ納得できます。「ブラックボックス」は公立の入試に不適です。

 統計処理についても英語スピーキングテストの開発で知られる羽藤由美さんがツイッターで疑問視しています。

引用D

ここでいう「IRT処理」とは,同じ仕様のテストの異なるバージョンを受験しても,同じ能力なら同じ成績が返されるようにスコアを標準化すること。(1)問題項目, (2)評価者, (3)受験者のどれも重複しない(基準になるものがない)ところで,どうやって標準化したスコアを出すというのか?都教委は嘘も程々に

 いたるところ「ブラックボックス」な試験を1点を争う高校入試に使うの?(# ゚Д゚)

3)あの検定とクリソツ?

 大津さんや羽藤さんによると、ベネッセコーポレーションの英語技能検定であるGTEC(core)とESAT-Jはパート数、出題形式、問題数、果ては準備時間や解答時間まで瓜二つだそうです。

資料5 EduA

www.asahi.com

 GTECで「テスト慣れ」しておくとスピーキング力がつくかはともかくESAT-Jでよい点数がとれるかもしれません。実際に東京都の自治体で中学生全員にGTECを受験させているところもあります。

 これに対して東京都は「両者は別物である」「市区町村が決めること」「ベネッセと結んだ覚書には利益相反行為の禁止の項目があり、関連する企業についてもベネッセ側が自主的に制限している」としています。

 しかし東京都が大学入試センターのような機関を立ち上げて自前で実施し、塾が知恵を絞って対策するのは問題ないですが、民間企業にテストを委託して、しかもその業者が実施するテストとそっくりならば、生徒や保護者や学校や自治体が「その企業のテストを受験すれば有利になるかも」と考えて当然です。

 民間企業が公的な入試に参入すれば利益相反疑惑は避けられません。

4)タブレット使いまわしもクリソツ?

資料6 EduA

www.asahi.com

引用E

都教委は、3月30日に出したESAT-J実施概要(案)の中で、「事業者が用意するタブレット端末等を用いて、解答音声を録音する方式で実施する。また、受験者を前半実施組と後半実施組の2組に分け、タブレット端末を移動させる形式で実施する」と実施方法を示している。

 

(゚Д゚)ハァ?

 

  GTECの四技能は2017年からの実施で、スピーキングテストはタブレットに音声を吹き込む形式です(当時の名称は「GTEC for student」 現在は「GTEC検定版」。一般向けの「GTEC・CBT」とは別もの)。

 これは学校実施のみで、40人詰まった教室で生徒それぞれがタブレットに向けて一方的に「話し」ます。「隣の生徒の流暢な回答を "repeat after me” できちゃう問題」「隣の生徒の音まで拾っちゃう問題」が取りざたされました(ベネッセも途中からヘッドホンにイヤーマフを追加しました)。

 ぶんぶんの勤務校がGTECをやめた理由のひとつは「タブレットの使いまわし」です。

 地方に住むぶんぶんがGTECを実施した5年前は、都会の重点校のように社員は来ず、教員が数日前に宅配業者から送られてくるタブレットと問題をクラス別に分け、不具合や落丁がないかチェックします。

 タブレットは人数の半分しかないので、筆記とスピーキングを交代で行い(実施マニュアルにそう書いてある)、タブレットの移動は教員の仕事で、40台をかごに入れると想像を絶する重さです。

 一流企業ベネッセコーポレーションなら、すでにタブレットは全員分用意していると思い込んでいましたが(このコロナ禍で他人が触ったタブレット使う?)、ESAT-Jでは使いまわしのようです。

 タブレット使いまわしの最大の問題は入試の公平性を揺るがすことです。同じ問題を前半・後半で分けて実施となれば、政府がICT活用を奨励する今日、その気になれば情報交換が可能です。彼らは「デジタルネイティブ」ですよ?

 GTECは自身の英語力を試す機会なのでズルしても意味ないのですが(ただし立教大学のように英語試験に代用する大学もあり)、ESAT-Jは高校入試の20点分です。「入試は性悪説で制度設計」は当たり前です。

 

② ESAT-Jを入試に使う問題点

1)その1点差が4点差になるの?

 満点26点が「ブラックボックス」の中で0~100点に点数化され、6グレードに振り分けられたものを、内申で再度A20点、B16点…と4点刻みで点数化します。

田中真美さんのTwitterより。現物は東京教育庁HP 引用G

 このため、スコア90点と80点では10点差あっても内申点は同じ20点、80点と79点は1点差だけど内申点は4点の差がつくことになります。

 陸上競技だと0.01秒違っても順位は順位ですが「素点」だから納得できます。加工のし過ぎで最初の点数で彼らにどれだけの差があったのか見当もつかず、開示にも応じてもらえません。

2)成績は1月中旬にしか届かない?

 一般選抜(学力検査に基づく選抜の第一次募集・分割前期募集は30,306人)からの活用になりますが、出願締め切りが2月の初旬なので、結果が返ってくる前には志望校は決まっている気がします。

3)英語の点数だけ多すぎない?

 引用Bによると英語以外の5教科の内申点は最大23点、英語だけ43点になります。英語を重視する高校が英語の点数をかさ上げするならまだしも、すべての高校で一律に英語の点数が高いと英語が苦手な生徒には不利です。

 だいたい英語の評価の中にスピーキングも入っているわけですから、さらに20点足す必要はありません。「四技能をバランスよく」はどこへ?

4)機械のトラブルと対策は?

 松井さんによると(資料2)、羽藤先生が在籍していた京都工芸繊維大学で800人に対するスピーキングテストをして1件のトラブルが発生したそうです。東京都のプレテストは64,218人で行われましたが、事故やミスに関するレポートが一切上がっていないとのことです。(+_+)

 ぶんぶんの勤務校で出来立ての「GTEC for student4技能版」に挑戦した時、端末のバッテリー切れやアプリの不具合、生徒の押し間違いなどが複数発生しました。うちだけかと思ってお友達の高校に聞いても同じでした。

 松井さんは「音声が回収できない、音源の喪失、録音レベルが低くて再生するとノイズが入る、は必ず発生する。プレテストはそれに対してどういう手当をするかを検証するために行われるもの」と主張しています。

5)不受験者は同じ高校を受験した生徒の成績で決まる?

 都教委は2022年5月26日、都立入試のESAT-Jの不受験者の扱いを公表しました。

資料7 リセマム

resemom.jp

 不受験者の「仮のESAT-J結果」は、英語学力検査の得点で順位を決め、不受験者と英語学力検査の得点が同じ者のESAT-J結果を点数化し、その平均値から求めます

*不受験者とはESAT-J実施日にインフルエンザ等による出席停止ややむを得ない理由で受験することができなかった東京都の公立中学生およびそれらに在籍していない中学生(私立中学校在籍者、他県中学校在籍者等)です。

 

(゚Д゚)ハァ?(゚Д゚)ハァ?(゚Д゚)ハァ?

 

 本日最大にヤバいです。

 まず筆記試験からスピーキングテストの見込み点、しかも同点の他人のスコアから算出することが信じられません

 ぶんぶんは校長から「考査を欠席しても見込み点はあり得ない。必ず追試験または本人がやあった代替のもので評価するように」ときつーく言われています。東京都は他人の点数で見込み点を出してOKなんですか?

 また松井さんは3月30日の記者会見で「都立高校の入試では共通問題と独自問題(難しい)を実施する高校があり、不公平が生じる」と指摘しました(資料2)。

 そこで東京都教育委員会は、同じ高校を受けた生徒の英語の点数を並べて、不受験者と同点生徒のESAT-Jの点数の平均から不受験者に仮の結果をつけるとしました。

 大津さんがテスト理論の第一人者である南風原朝和さんに「仮のESAT-J結果の求め方」について質問したところ、南風原さんは「(全受験生ではなく)高校ごとなら同点はわずか数名ということもあり、人数が少なすぎると平均は安定せず、例えば筆記75点の受験生10名のESAT-J平均点が筆記70点の受験生のそれを下回るような逆転も容易に起こりえる」としています。

 つまり、筆記75点の不受験者Xさんが同点者のESAT-Jが低くてC(12点)、筆記70点の不受験者Yさんの同点者のESAT-Jが高くてA(20点)だったら、YさんがXさんを上回る、のように、たまたま同点だった他人のスコアで逆転が起こるということです。

  南風原さんの結論は「これでは入学者選抜として成り立ちません」です。

 

 アウトです。(´・ω・`) 

 

資料8 大津さんのブログ 他にもテスト理論の先生から厳しい意見が届いています。

松井さんの資料2も見てください。

www.kotoba1.com

追記 6月27日

松井さんの詳細なシミュレーション

note.com

 都教委さん、制度上の欠陥が直せないからといって中学の教員に中学生に欠席しないようにプレッシャーをかけさせるような下品な真似はしてませんよね?

3 まとめ

2022年3月30日「入試改革を考える会」記者会見 

www.youtube.com

 会見で英語教育学の第一人者である鳥飼玖美子さんは「話す力ほど測定が困難なものはない。入試で使うことは妥当ではない」と一刀両断しています。

 鳥飼さんは「話す力」とは「異文化コミュニケーション」、すなわちその場の状況、相手との関係性、互いの文化の違いが複雑に絡んでいるのに、その辺が理解されていないと苦言を呈します。

 ポンコツ入試改革で「錦の御旗」として使われた「CEFR」を東京都がESAT-Jで蒸し返していますが、鳥飼さんによるとCEFRは2018年に増補されていて、伝統的な4技能はコミュニケーション能力を図るには不十分、「話す」と「書く」に「やり取り」が、そして「仲介」が新たに追加されて7技能になりました。

*鳥飼さんの「ESAT-JのスコアレポートはCEFRを恣意的に利用していて中学生の実態に全く即していない」という指摘は興味深いので動画をご覧ください。

 つまりタブレットに録音するスピーキングテストを「入試に必要」という「餌」で受験させると、中学はその対策に時間を費やすことになり、「やりとりとしての話す力」の育成がおろそかになる(むしろ邪魔になる)、とぶんぶんは思います。 

 鳥飼さんは「『スピーキングテストをやれば話せるようになるんじゃないの?』という人もいるが『話す』は簡単なことではない。日常会話の決まり文句を覚えて試験対策をしても話せるようにならないし仕事にも使えない。仕事で英語を使えるようになるには、内容とそれをどう論理的に組み立てるか、英語を自分の思考に乗せられるかが大事で、それは一朝一夕でできるものではない」と続けます。

 そして「中学生は母語がある程度確立して、吸収力や柔軟性もあり、外国語学習には最適な時期。どうにもならないような試験対策に貴重な時間を費やすよりは、英語の基礎(音とリズム、語彙、文の組み立て)を学ぶべき」と訴えます。

 

おっしゃる通りです。<(_ _)>

 

 「入試問題を考える会」の大内裕和さんが言うように、英語やスピーキングに関心がある人ほど、この制度は「おかしい」と思えるはずです。

 

おわりに

 鳥飼さんが言ってましたが、英語外部試験必須化がストップした時は、萩生田文部科学大臣の「身の丈発言」=「経済的・地理的格差」というわかりやすい点だけがメディアに取り上げられましたが、「話す力とは何でどうすれば育成できるのか」「それは試験にフィットするのか」には関心が集まりませんでした。

 他にも民間企業の公教育(特に入試)への参入、入試で教育を変えるという幻想、理念を制度に落とし込めずグダグダになってもとまらない(現場の教員も反対しない)など、とどめを刺しそこなったゾンビが都庁を占領した思いです。

 今回整理してみて、このテストでは話す力はつかないどころか逆効果もあり得る、試験の仕組みも公平性が担保されていない、情報公開に耐えられない、入試として破綻しています。

 誰も得をしないこの制度、「東京都でやってるのに〇〇県はやらないんですか?」という営業トークに県教委がホイホイ乗ったら困るので、白紙撤回を望みます。

  代わりと言っては何ですが、東京都は海外の小国ぐらいの予算をお持ちですから、中高の英語授業20人学級を実現して文科省の鼻を明かすのはいかがでしょうか。 

 田中真美さん作のツイデモ用キャッチ画像、最初はお化けが描かれていましたが、ぶんぶんがつまらないことを呟いたらわざわざゾンビに変更していただきました。今回はツイデモの書き込みやリンクを参考にしました。参加者のみなさん、ありがとうございました。