玩電腦不一定懂電腦,好多人對搜索引擎這一概念不熟悉,搜索引擎指的是什么?所謂搜索引擎,就是根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出制定信息反饋給用戶的一門檢索技術。
玩電腦不一定懂電腦,好多人對搜索引擎這一概念不熟悉,搜索引擎指的是什么?所謂搜索引擎,就是根據(jù)用戶需求與一定算法,運用特定策略從互聯(lián)網(wǎng)檢索出制定信息反饋給用戶的一門檢索技術。搜索引擎依托于多種技術,如網(wǎng)絡爬蟲技術、檢索排序技術、網(wǎng)頁處理技術、大數(shù)據(jù)處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創(chuàng)造更好的網(wǎng)絡使用環(huán)境。
主要特點
1、信息抓取迅速
在大數(shù)據(jù)時代,網(wǎng)絡產(chǎn)生的信息浩如煙海,令人無所適從,難以得到自己需要的信息資源。在搜索引擎技術
的幫助下,利用關鍵詞、高級語法等檢索方式就可以快速捕捉到相關度極高的匹配信息。
2、深入開展信息挖掘
搜索引擎在捕獲用戶需求的信息的同時,還能對檢索的信息加以一定維度的分析,以引導其對信息的使用與認識。例如,用戶可以根據(jù)檢索到的信息條目判斷檢索對象的熱度,還可以根據(jù)檢索到的信息分布給出高相關性的同類對象,還可以利用檢索到的信息智能化給出用戶解決方案,等等。
3、檢索內(nèi)容的多樣化和廣泛性。
隨著搜索引擎技術的日益成熟,當代搜索引擎技術幾乎可以支持各種數(shù)據(jù)類型的檢索,例如自然語言、智能語言、機器語言等各種語言。目前,不僅視頻、音頻、圖像可以被檢索,而且人類面部特征、指紋、特定動作等也可以被檢索到??梢韵胂?,在未來幾乎一切數(shù)據(jù)類型都可能成為搜索引擎的檢索對象。
面臨問題
1.網(wǎng)頁時效性
互聯(lián)網(wǎng)上的用戶眾多,數(shù)據(jù)信息來源極廣,互聯(lián)網(wǎng)上的網(wǎng)頁是呈實時動態(tài)變化的,網(wǎng)頁的更新、刪除等變動極為頻繁,有時候會出現(xiàn)新更新的網(wǎng)頁在爬蟲程序還來不及抓取的時候卻已經(jīng)被刪除的情況,這將大大影響搜索結果的準確性。
2.大數(shù)據(jù)存儲問題
爬蟲抓取的數(shù)據(jù)在經(jīng)過預處理后數(shù)據(jù)量依然相當龐大,這給大數(shù)據(jù)存儲技術帶來相當大的挑戰(zhàn)。當前大部分搜索引擎都是利用結構化的數(shù)據(jù)庫來存儲數(shù)據(jù),結構化的數(shù)據(jù)庫存儲的數(shù)據(jù)具有高共享、低冗余等特點,然而由于結構化的數(shù)據(jù)庫難以并發(fā)查詢所以存在查詢效率受限的問題。
3.檢索結果可靠性
目前由于數(shù)據(jù)挖掘技術以及計算機硬件的限制使得數(shù)據(jù)處理準確度未能達到理想程度,而且由于一些個人或公司利用搜索引擎現(xiàn)有的漏洞通過作弊手段來干擾檢索結果導致檢索結果的可靠性可能會有損失。
發(fā)展趨勢
1、社會化搜索
社交網(wǎng)絡平臺和應用占據(jù)了互聯(lián)網(wǎng)的主流,社交網(wǎng)絡平臺強調(diào)用戶之間的聯(lián)系和交互,這對傳統(tǒng)的搜索技術提出了新的挑戰(zhàn)。
傳統(tǒng)搜索技術強調(diào)搜索結果和用戶需求的相關性,社會化搜索除了相關性外,還額外增加了一個維度,即搜索結果的可信賴性。對某個搜索結果,傳統(tǒng)的結果可能成千上萬,但如果處于用戶社交網(wǎng)絡內(nèi)其他用戶發(fā)布的信息、點評或驗證過的信息則更容易信賴,這是與用戶的心里密切相關的。社會化搜索為用戶提供更準確、更值得信任的搜索結果。
2、實時搜索
對搜索引擎的實時性要求日益增高,這也是搜索引擎未來的一個發(fā)展方向。
實時搜索最突出的特點是時效性強,越來越多的突發(fā)事件首次發(fā)布在微博上,實時搜索核心強調(diào)的就是“快”,用戶發(fā)布的信息第一時間能被搜索引擎搜索到。不過在國內(nèi),實時搜索由于各方面的原因無法普及使用,比如Google的實時搜索是被重置的,百度也沒有明顯的實時搜索入口。
3、移動搜索
隨著智能手機的快速發(fā)展,基于手機的移動設備搜索日益流行,但移動設備有很大的局限性,比如屏幕太小,可顯示的區(qū)域不多,計算資源能力有限,打開網(wǎng)頁速度很慢,手機輸入繁瑣等問題都需要解決。
目前,隨著智能手機的快速普及,移動搜索一定會更加快速的發(fā)展,所以移動搜索的市場占有率會逐步上升,而對于沒有移動版的網(wǎng)站來說,百度也提供了“百度移動開放平臺”來彌補這個缺失。
4、個性化搜索
個性化搜索主要面臨兩個問題:如何建立用戶的個人興趣模型?在搜索引擎里如何使用這種個人興趣模型?
個性化搜索的核心是根據(jù)用戶的網(wǎng)絡行為,建立一套準確的個人興趣模型。而建立這樣一套模型,就要全民收集與用戶相關的信息,包括用戶搜索歷史、點擊記錄、瀏覽過的網(wǎng)頁、用戶E-mail信息、收藏夾信息、用戶發(fā)布過的信息、博客、微博等內(nèi)容。比較常見的是從這些信息中提取出關鍵詞及其權重。為不同用戶提供個性化的搜索結果,是搜索引擎總的發(fā)展趨勢,但現(xiàn)有技術有很多問題,比如個人隱私的泄露,而且用戶的興趣會不斷變化,太依賴歷史信息,可能無法反映用戶的興趣變化。
5、地理位置感知搜索
目前,很多手機已經(jīng)有GPS的應用了,這是基于地理位置感知的搜索,而且可以通過陀螺儀等設備感知用戶的朝向,基于這種信息,可以為用戶提供準確的地理位置服務以及相關搜索服務。目前,此類應用已經(jīng)大行其道,比如手機地圖APP。
6、跨語言搜索
如何將中文的用戶查詢翻譯為英文查詢,目前主流的方法有3種:機器翻譯、雙語詞典查詢和雙語語料挖掘。對于一個全球性的搜索引擎來說,具備跨語言搜索功能是必然的發(fā)展趨勢,而其基本的技術路線一般會采用查詢翻譯加上網(wǎng)頁的機器翻譯這兩種技術手段。
7、多媒體搜索
目前,搜索引擎的查詢還是基于文字的,即使是圖片和視頻搜索也是基于文本方式。那么未來的多媒體搜索技術則會彌補查詢這一缺失。多媒體形式除了文字,主要包括圖片、音頻、視頻。多媒體搜索比純文本搜索要復雜許多,一般多媒體搜索包含4個主要步驟:多媒體特征提取、多媒體數(shù)據(jù)流分割、多媒體數(shù)據(jù)分類和多媒體數(shù)據(jù)搜索引擎。
8、情境搜索
情境搜索是融合了多項技術的產(chǎn)品,上面介紹的社會化搜索、個性化搜索、地點感知搜索等都是支持情境搜索的,目前Google在大力提倡這一概念。所謂情境搜索,就是能夠感知人與人所處的環(huán)境,針對“此時此地此人”來建立模型,試圖理解用戶查詢的目的,根本目標還是要理解人的信息需求。比如某個用戶在蘋果專賣店附近發(fā)出“蘋果”這個搜索請求,基于地點感知及用戶的個性化模型,搜索引擎就有可能認為這個查詢是針對蘋果公司的產(chǎn)品,而非對水果的需求。
想要了解更多行業(yè)專業(yè)分析,請關注中研普華研究報告《2020-2025年中國計算機系統(tǒng)集成行業(yè)全景調(diào)研與發(fā)展戰(zhàn)略研究咨詢報告》
2020-2025年中國計算機系統(tǒng)集成行業(yè)全景調(diào)研與發(fā)展戰(zhàn)略研究咨詢報告
產(chǎn)業(yè)現(xiàn)狀多元化與專業(yè)化是計算機系統(tǒng)集成的重要方向,專業(yè)化是企業(yè)專業(yè)技術發(fā)展水平的體現(xiàn),多元化是研究企業(yè)整合工作的宏觀視野和思考。近年來,隨著中國科技的不斷發(fā)展和創(chuàng)新,互聯(lián)網(wǎng)逐漸與我...
查看詳情
產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報告 商業(yè)計劃書 細分市場研究 IPO上市咨詢
中研網(wǎng)
發(fā)現(xiàn)資訊的價值
研究院
掌握產(chǎn)業(yè)最新情報
中研網(wǎng)是中國領先的綜合經(jīng)濟門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領域,致力于為中高端人士提供最具權威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟新聞進行及時追蹤報道,并對熱點行業(yè)專題探討及深入評析。以獨到的專業(yè)視角,全力打造中國權威的經(jīng)濟研究、決策支持平臺!
廣告、內(nèi)容合作請點這里尋求合作
2020建材機械制造行業(yè)深度調(diào)研及市場投資價值評估建材機械產(chǎn)業(yè)主要包括原材料產(chǎn)業(yè)(如鋁錠、金屬材料、專用泥土等)、...
家居建材市場供需情況如何?隨著商務部流通業(yè)發(fā)展司、中國建筑材料流通協(xié)會共同發(fā)布了2018年12月份全國建材家居景氣指B...
2020中醫(yī)藥產(chǎn)業(yè)發(fā)展前景及規(guī)模預測中醫(yī)藥學是中國古代科學的瑰寶,也是打開中華文明寶庫的鑰匙。從文化學的角度研究中...
2020高等教育行業(yè)全景調(diào)研及未來發(fā)展趨勢分析2018年8月28日,國家層面的高?!半p一流”建設行動指南,在千呼萬喚中正3...
五糧液市值沖破萬億隨著白酒三季報行情開啟,板塊連日大漲,五糧液股價不斷創(chuàng)新高。11月5日早盤,五糧液漲超2%,市值...
診斷試劑行業(yè)在國內(nèi)為新興行業(yè),與歐美發(fā)達國家相比,發(fā)展相對落后。目前國內(nèi)診斷試劑行業(yè)生產(chǎn)企業(yè)約300-400家,其中2...
中研普華集團聯(lián)系方式廣告服務版權聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2020 ChinaIRN.COM All Rights Reserved. 版權所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”) 粵ICP備18008601號