新高考適配位次轉(zhuǎn)換算法是如何轉(zhuǎn)換的

2024-05-22 12:31:25 大風(fēng)車(chē)考試網(wǎng)

對(duì)于第一次進(jìn)行新高考的省份來(lái)說(shuō)，如何參考?xì)v年數(shù)據(jù)是最核心的問(wèn)題；對(duì)應(yīng)到實(shí)際數(shù)據(jù)和算法上，即要解決兩個(gè)關(guān)鍵點(diǎn)：

1. 不分文理的選科專(zhuān)業(yè)如何對(duì)應(yīng)到歷年的分文理專(zhuān)業(yè)

2. 歷年分文理的錄取排名如何換算到不分文理的排名

一、關(guān)鍵點(diǎn)1??招生/錄取專(zhuān)業(yè)對(duì)應(yīng)

這個(gè)問(wèn)題本身不復(fù)雜，但很繁瑣，因?yàn)閿?shù)據(jù)的邊界情況很難窮盡。

1. 如果歷年招生計(jì)劃的專(zhuān)業(yè)名稱(chēng)沒(méi)有變化，例如2016-2019年A大學(xué)的B專(zhuān)業(yè)招生名稱(chēng)是“計(jì)算機(jī)科學(xué)與技術(shù)”，2020年的招生名稱(chēng)也是“計(jì)算機(jī)科學(xué)與技術(shù)”，那可以直接對(duì)應(yīng)。

2. 如果歷年的招生計(jì)劃專(zhuān)業(yè)名稱(chēng)發(fā)生了變化（變化原因有很多，例如改名、批次變更、合并等等），例如2016-2019年A大學(xué)的B專(zhuān)業(yè)招生名稱(chēng)是“計(jì)算機(jī)科學(xué)與技術(shù)（中外合辦）”，2020年的招生名稱(chēng)改成“計(jì)算機(jī)科學(xué)與技術(shù)（中外合作辦學(xué)）”，這種情況在用類(lèi)似Excel的vlookup精確查找函數(shù)去做時(shí)，就會(huì)找不到數(shù)據(jù)，如果用簡(jiǎn)單的模糊匹配又很容出錯(cuò)。

對(duì)于第二種情況，研究院給出的解決辦法是，通過(guò)AI學(xué)習(xí)了2016-2019年每個(gè)省份每個(gè)學(xué)校的招生專(zhuān)業(yè)，機(jī)器自動(dòng)匹配可以解決大部分（在上面的例子里，機(jī)器可以準(zhǔn)確識(shí)別出“中外合辦”和“中外合作辦學(xué)”是同樣的語(yǔ)義），少量機(jī)器無(wú)法確認(rèn)的，會(huì)反饋出來(lái)，由人工點(diǎn)選確認(rèn)，以此來(lái)確定邊界的識(shí)別廣度范圍和數(shù)據(jù)的準(zhǔn)確性。

二、關(guān)鍵點(diǎn)2??排名換算

相比第1個(gè)關(guān)鍵點(diǎn)，相信關(guān)鍵點(diǎn)2是更多人關(guān)心的問(wèn)題。歷年的錄取數(shù)據(jù)都是分文理的情況，如何在不分文理招生的時(shí)候進(jìn)行參考；對(duì)于大部分人來(lái)說(shuō)，第一反應(yīng)能想到的肯定是通過(guò)乘以某個(gè)系數(shù)比例，進(jìn)行簡(jiǎn)單換算，僅此而已。對(duì)此，研究院的同學(xué)對(duì)幾種算法進(jìn)行了對(duì)比

1. 分?jǐn)?shù)等比例法

認(rèn)為?科分?jǐn)?shù)的前x%分位點(diǎn)對(duì)應(yīng)與理科分?jǐn)?shù)的前x%分位點(diǎn)，擬合曲線(xiàn)如下圖

2.排名等比例法

認(rèn)為?科排名的前x%分位點(diǎn)對(duì)應(yīng)與理科排名的前x%分位點(diǎn)，擬合曲線(xiàn)如下圖

3.研究院自研的線(xiàn)性擬合LM+KNN算法

KNN：核心是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別，則該樣本也屬于這個(gè)類(lèi)別，并具有這個(gè)類(lèi)別上樣本的特性。該方法在確定分類(lèi)決策上只依據(jù)最鄰的一個(gè)或者幾個(gè)樣本的類(lèi)別來(lái)決定待分樣本所屬的類(lèi)別。

線(xiàn)性擬合：曲線(xiàn)擬合的一種形式。設(shè)x和y都是被觀(guān)測(cè)的量，且y是x的函數(shù)：y=f(x; b)，曲線(xiàn)擬合就是通過(guò)x,y的觀(guān)測(cè)值來(lái)尋求參數(shù)b的最佳估計(jì)值，及尋求最佳的理論曲線(xiàn)y=f(x; b)。當(dāng)函數(shù)y=f(x; b)為關(guān)于b的i線(xiàn)性函數(shù)時(shí)，稱(chēng)這種曲線(xiàn)擬合為線(xiàn)性擬合。

忽略這些晦澀的專(zhuān)業(yè)術(shù)語(yǔ)，簡(jiǎn)單來(lái)說(shuō)就是：在舊高考時(shí)同一個(gè)學(xué)校在文理兼招的專(zhuān)業(yè)，招到的文科學(xué)生和理科學(xué)生的實(shí)力差距是相對(duì)穩(wěn)定的（畢竟是那么多年考生用分?jǐn)?shù)投票的結(jié)果），但不同層次學(xué)校的差距是有差距的。最終通過(guò)對(duì)不同層次的學(xué)校擬合后，即得到對(duì)應(yīng)關(guān)系，曲線(xiàn)如下：