百度筆試題和面試題答案(最新)

大風(fēng)車(chē)考試網(wǎng)

  英文拼寫(xiě)糾錯(cuò)

  在用戶(hù)輸入英文單詞時(shí),經(jīng)常發(fā)生錯(cuò)誤,我們需要對(duì)其進(jìn)行糾錯(cuò)。假設(shè)已經(jīng)有一個(gè)包含了正確英文單詞的詞典,請(qǐng)你設(shè)計(jì)一個(gè)拼寫(xiě)糾錯(cuò)的程序。

  (1)請(qǐng)描述你解決這個(gè)問(wèn)題的思路;

  (2)請(qǐng)給出主要的處理流程,算法,以及算法的復(fù)雜度;

  (3)請(qǐng)描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個(gè)開(kāi)放問(wèn)題)。

  解答:

  (1)思路 :

  字典以字母鍵樹(shù)組織,在用戶(hù)輸入同時(shí)匹配

  (2)流程:

  每輸入一個(gè)字母:

  沿字典樹(shù)向下一層,

  a)若可以順利下行,則繼續(xù)至結(jié)束,給出結(jié)果;

  b)若該處不能匹配,糾錯(cuò)處理,給出拼寫(xiě)建議,繼續(xù)至a);

  算法:

  1.在字典中查找單詞

  字典采用27叉樹(shù)組織,每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)字母,查找就是一個(gè)字母一個(gè)字母匹配.算法時(shí)間就是單詞的長(zhǎng)度k.

  2.糾錯(cuò)算法

  情況:當(dāng)輸入的最后一個(gè)字母不能匹配時(shí)就提示出錯(cuò),簡(jiǎn)化出錯(cuò)處理,動(dòng)態(tài)提示可能處理方法:

  (a)當(dāng)前字母前缺少了一個(gè)字母:搜索樹(shù)上兩層到當(dāng)前的匹配作為建議;

  (b)當(dāng)前字母拼寫(xiě)錯(cuò)誤:當(dāng)前字母的鍵盤(pán)相鄰作為提示;(只是簡(jiǎn)單的描述,可以有更多的)

  根據(jù)分析字典特征和用戶(hù)單詞已輸入部分選擇(a),(b)處理

  復(fù)雜性分析:影響算法的效率主要是字典的實(shí)現(xiàn)與糾錯(cuò)處理

  (a)字典的實(shí)現(xiàn)已有成熟的算法,改進(jìn)不大,也不會(huì)成為瓶頸;

  (b)糾錯(cuò)策略要簡(jiǎn)單有效 ,如前述情況,是線性復(fù)雜度;

  (3)改進(jìn)

  策略選擇最是重要,可以采用統(tǒng)計(jì)學(xué)習(xí)的方法改進(jìn)。

  尋找熱門(mén)查詢(xún)

  搜索引擎會(huì)通過(guò)日志文件把用戶(hù)每次檢索使用的所有檢索串都記錄下來(lái),每個(gè)查詢(xún)串的長(zhǎng)度為1-255字節(jié)。假設(shè)目前有一千萬(wàn)個(gè)記錄,這些查詢(xún)串的重復(fù)度比較高,雖然總數(shù)是1千萬(wàn),但如果除去重復(fù)后,不超過(guò)3百萬(wàn)個(gè)。一個(gè)查詢(xún)串的重復(fù)度越高,說(shuō)明查詢(xún)它的用戶(hù)越多,也就是越熱門(mén)。請(qǐng)你統(tǒng)計(jì)最熱門(mén)的10個(gè)查詢(xún)串,要求使用的內(nèi)存不能超過(guò)1G。

  (1)請(qǐng)描述你解決這個(gè)問(wèn)題的思路;

  (2)請(qǐng)給出主要的處理流程,算法,以及算法的復(fù)雜度。

  解答:

  (1)思路:

  用哈希做

  (2)

  首先逐次讀入查詢(xún)串,算哈希值,保存在內(nèi)存數(shù)組中,同時(shí)統(tǒng)計(jì)頻度(注意值與日志項(xiàng)對(duì)應(yīng)關(guān)系)選出前十的頻度,取出對(duì)應(yīng)的日志串,簡(jiǎn)單不過(guò)了。

  哈希的設(shè)計(jì)是關(guān)鍵。

  集合合并

  給定一個(gè)字符串的集合,格式如:

  {aaa bbb ccc}, {bbb ddd},{eee fff},{ggg},{ddd hhh}

  要求將其中交集不為空的集合合并,要求合并完成后的集合之間無(wú)交集,例如上例應(yīng)輸出{aaa bbb ccc ddd hhh},{eee fff}, {ggg}

  (1)請(qǐng)描述你解決這個(gè)問(wèn)題的思路;

  (2)請(qǐng)給出主要的處理流程,算法,以及算法的復(fù)雜度

  (3)請(qǐng)描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個(gè)開(kāi)放問(wèn)題)。

  解答:

  (1)思路:先將集合按照大小排列后,優(yōu)先考慮小的集合是否與大的集合有交集。有就合并,如果小集合與所有其他集合都沒(méi)有交集,則獨(dú)立。獨(dú)立的集合在下一輪的比較中不用考慮。這樣就可以盡量減少字符串的比較次數(shù)。當(dāng)所有集合都獨(dú)立的時(shí)候,就終止。

  (2)處理流程:

  1.將集合按照大小排序,組成集合合并待處理列表

  2.選擇最小的集合,找出與之有交集的集合,

  如果有,合并之;

  如果無(wú),則與其它集合是獨(dú)立集合,從待處理列表 中刪除。

  3.重復(fù)直到待處理列表為空

  算法:

  1。將集合按照大小從小到大排序,組成待處理的集合列表。

  2。取出待處理集合列表中最小的集合,對(duì)于集合的每個(gè)元素,依次在其他集合中搜索是否有此元素存在:

  1>若存在,則將此小集合與大集合合并,并根據(jù)大小插入對(duì)應(yīng)的位置 。轉(zhuǎn)3。

  2>若不存在,則在該集合中取下一個(gè)元素。如果無(wú)下一個(gè)元素,即所有元素都不存在于其他集合。則表明此集合獨(dú)立,從待處理集合列表中刪除。并加入結(jié)果集合列表。轉(zhuǎn)3。

  3。如果待處理集合列表不為空,轉(zhuǎn)2。如果待處理集合列表為空,成功退出,則結(jié)果集合列表就是最終的輸出。

  算法復(fù)雜度分析:

  假設(shè)集合的個(gè)數(shù)為n,最大的集合元素為m

  排序的時(shí)間復(fù)雜度可以達(dá)到n*log(n)

  然后對(duì)于元素在其他集合中查找,最壞情況下為(n-1)*m

  查找一個(gè)集合是否與其他集合有交集的最壞情況是m*m*(n-1)

  合并的時(shí)間復(fù)雜度不會(huì)超過(guò)查找集合有交集的最壞情況。

  所以最終最壞時(shí)間復(fù)雜度為O(m*m*n*n)

  需要說(shuō)明的是:此算法的平均時(shí)間復(fù)雜度會(huì)很低,因?yàn)闊o(wú)論是查找還是合并,都是處于最壞情況的概率很小,而且排序后優(yōu)先用最小集合作為判斷是否獨(dú)立的對(duì)象,優(yōu)先與最大的集合進(jìn)行比較,這些都最大的回避了最壞情況。

  (3)可能的改進(jìn):

  首先可以實(shí)現(xiàn)將每個(gè)集合里面的字符串按照字典序進(jìn)行排列,這樣就可以將查找以及合并的效率增高。

  另外,可能采取恰當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)也可以將查找以及合并等操作的效率得到提高。

  需要引入用戶(hù)對(duì)搜索結(jié)果相關(guān)性的評(píng)分

  需求:需要引入用戶(hù)對(duì)搜索結(jié)果相關(guān)性的評(píng)分,100分制。希望用戶(hù)的打分能幫助搜索引擎排序,但又避免惡意投票、作弊等。請(qǐng)?jiān)O(shè)計(jì)一個(gè)比較公平的評(píng)分系統(tǒng)。

  輸入:N(整數(shù))

  輸入:N(整數(shù))

  輸入:數(shù)據(jù)文件A.txt,不超過(guò)6條記錄,字符串長(zhǎng)度不超過(guò)15個(gè)字節(jié)

  文件格式如下:

  字符串/t數(shù)字/n

  說(shuō)明:

  每行為1條記錄;字符串中不含有/t。

  數(shù)字描述的是該字符串的出現(xiàn)概率,小于等于100的整數(shù)。

  多條記錄的出現(xiàn)概率之和為100,如果A.txt不滿(mǎn)足該條件,程序則退出;

  如果文件格式錯(cuò)誤,程序也退出。

  要求:

  編寫(xiě)一個(gè)程序,輸入為N(正整數(shù)),讀入文件A.txt,按照字符串出現(xiàn)概率隨機(jī)地輸出字符串,輸出N條記錄

  例如:

  輸入文件A.txt

  abc/t20

  a/t30

  de/t50

  輸入為:10

  即 abc有20%的概率輸出,a有30%的概率輸出,de有50%的概率輸出,輸出10條記錄

  以下為一次輸出的結(jié)果,多次輸出的結(jié)果可能不相同。

  abc

  a

  de

  de

  abc

  de

  a

  de

  a

  de

  解答:

  這個(gè)題目感覺(jué)意思有歧義。什么是”按照字符串出現(xiàn)概率隨機(jī)地輸出字符串,輸出N條記錄”?可以有幾種理解。第一,每次擲骰子,擲出了哪個(gè)就輸出哪個(gè),不管前面輸出了什么。第二,要考慮前面出現(xiàn)的字符串。按照題目里的例子,如果前面輸出了兩次abc,那接下來(lái)的無(wú)論隨機(jī)出了什么數(shù),都不能輸出abc,最后的結(jié)果在數(shù)量上符合開(kāi)始給的概率條件,只是順序有所不同。這讓我想起了排列組合里的袋中取黑球紅球問(wèn)題。把字符串a(chǎn)bc,a,de當(dāng)作2個(gè)紅球,3個(gè)黑球和 5個(gè)白球,放入袋中。每次拿一個(gè)球出來(lái),并記錄拿出球的顏色。第一種情況就是拿出球后,把球放回袋中進(jìn)行下一次抽取;而第二種自然就是不放回的抽取。

  • 相關(guān)文章
  • 軟件測(cè)試筆試題和面試題答案(精華篇)軟件測(cè)試筆試題和面試題答案(精華篇)

    三、名詞解釋 1、Beta測(cè)試:Beta測(cè)試是從用戶(hù)角度進(jìn)行的測(cè)試,是由軟件的多個(gè)用戶(hù)在一個(gè)或多個(gè)用戶(hù)的實(shí)際使用環(huán)境下進(jìn)行的測(cè)試。它是在開(kāi)發(fā)者無(wú)法控制的軟件..

  • 軟件測(cè)試筆試題和面試題答案(精華篇)軟件測(cè)試筆試題和面試題答案(精華篇)

    如下四類(lèi)筆試題內(nèi)容是軟件測(cè)試最?嫉木A題,大家敬請(qǐng)收藏! 一、判斷正誤題 1、測(cè)試是證明軟件正確的方法。(×) 2、測(cè)試中應(yīng)該對(duì)有效和無(wú)效..

  • 最新軟件測(cè)試筆試題和面試題答案最新軟件測(cè)試筆試題和面試題答案

    16、為保證測(cè)試活動(dòng)的可控性,必須在軟件測(cè)試過(guò)程中進(jìn)行軟件測(cè)試配置管理,一般來(lái)說(shuō),軟件測(cè)試配置管理中最基本的活動(dòng)包括__A____ A、配置項(xiàng)標(biāo)識(shí)、配置項(xiàng)控..

  • 軟件測(cè)試筆試題和面試題答案(精華篇)軟件測(cè)試筆試題和面試題答案(精華篇)

    三、名詞解釋 1、Beta測(cè)試:Beta測(cè)試是從用戶(hù)角度進(jìn)行的測(cè)試,是由軟件的多個(gè)用戶(hù)在一個(gè)或多個(gè)用戶(hù)的實(shí)際使用環(huán)境下進(jìn)行的測(cè)試。它是在開(kāi)發(fā)者無(wú)法控制的軟件..

  • 軟件測(cè)試筆試題和面試題答案(精華篇)軟件測(cè)試筆試題和面試題答案(精華篇)

    如下四類(lèi)筆試題內(nèi)容是軟件測(cè)試最?嫉木A題,大家敬請(qǐng)收藏! 一、判斷正誤題 1、測(cè)試是證明軟件正確的方法。(×) 2、測(cè)試中應(yīng)該對(duì)有效和無(wú)效..

  • 最新軟件測(cè)試筆試題和面試題答案最新軟件測(cè)試筆試題和面試題答案

    16、為保證測(cè)試活動(dòng)的可控性,必須在軟件測(cè)試過(guò)程中進(jìn)行軟件測(cè)試配置管理,一般來(lái)說(shuō),軟件測(cè)試配置管理中最基本的活動(dòng)包括__A____ A、配置項(xiàng)標(biāo)識(shí)、配置項(xiàng)控..

  • 河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽(試題+答案完整版)河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽(試題+答案完整版)

    2016河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽開(kāi)賽啦,快來(lái)圍觀吧。活動(dòng)內(nèi)容為推動(dòng)“兩學(xué)一做”學(xué)習(xí)教育深入開(kāi)展,省委宣傳部、省委組織部組織開(kāi)展“兩學(xué)一做”知識(shí)競(jìng)賽活動(dòng),河北..

  • 河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽活動(dòng)試題答案河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽活動(dòng)試題答案

    2016年河北新聞網(wǎng)兩學(xué)一做知識(shí)競(jìng)賽活動(dòng)試題答案為推動(dòng)“兩學(xué)一做”學(xué)習(xí)教育深入開(kāi)展,省委宣傳部、省委組織部組織開(kāi)展“兩學(xué)一做”大型知識(shí)競(jìng)賽。此項(xiàng)活動(dòng)由河北新聞..

  • 兩學(xué)一做學(xué)習(xí)教育知識(shí)競(jìng)賽活動(dòng)10篇兩學(xué)一做學(xué)習(xí)教育知識(shí)競(jìng)賽活動(dòng)10篇

    為隆重紀(jì)念中國(guó)共產(chǎn)黨建黨95周年,推進(jìn)我市“兩學(xué)一做”學(xué)習(xí)教育深入開(kāi)展,推動(dòng)廣大黨員干部認(rèn)真學(xué)好黨章黨規(guī)和*系列重要講話,現(xiàn)將“兩學(xué)一做”學(xué)習(xí)教育知識(shí)競(jìng)賽題予..

  • 開(kāi)展兩學(xué)一做學(xué)習(xí)教育知識(shí)競(jìng)賽活動(dòng)真題答案開(kāi)展兩學(xué)一做學(xué)習(xí)教育知識(shí)競(jìng)賽活動(dòng)真題答案

    144.根據(jù)《中國(guó)共產(chǎn)黨紀(jì)律處分條例》規(guī)定,黨的各級(jí)代表大會(huì)的代表受到(D)處分的,黨組織應(yīng)當(dāng)終止其代表資格。A.警告(含)以上B.嚴(yán)重警告(含)以上C.撤銷(xiāo)黨內(nèi)職務(wù)(含)以..