語義搜索:數字出版的突破?
2011-08-25 08:52 來源:時代周報 責編:張招偉
- 摘要:
- 2011年8月22日,南國書香節現場,廣州華閱數碼科技公司和汕頭大學出版社簽訂戰略合作協議。由于合作涉及新的數字版閱讀平臺、意義搜索等內容,這對于方興未艾的中國數字出版市場來說,可能帶來的影響值得關注。加上這次合作還擁有一定的官方背景,廣東省新聞出版局、廣東數字出版產業聯合會都給予了支持。
【CPP114】訊:2011年8月22日,南國書香節現場,廣州華閱數碼科技公司和汕頭大學出版社簽訂戰略合作協議。由于合作涉及新的數字版閱讀平臺、意義搜索等內容,這對于方興未艾的中國數字出版市場來說,可能帶來的影響值得關注。加上這次合作還擁有一定的官方背景,廣東省新聞出版局、廣東數字出版產業聯合會都給予了支持。
“數字出版本身是廣東的強項,我們一直立足于成為這方面的全國標兵。”廣東省新聞出版局數字出版管理處處長、廣東數字出版產業聯合會執行副會長蘇毅接受時代周報記者采訪時難掩雄心。實際上,早在2010年,蘇毅就曾表示,成立廣東省數字出版產業聯合會是要進一步加強數字出版產業鏈上中下游的戰略合作。華閱數碼和汕頭大學出版社的合作無疑是其中的重要一步。
前景在于內容技術并濟
廣東數字出版產業起步較早,2008年全國數字出版總收入530億元,其中廣東占100億元;2009年全國預計達750億元,廣東占150億元。在去年第三屆中國數字出版博覽會上,廣東是獲獎最多的省份,并囊括了業界公認難度最大的“創新技術獎”過半獎項。蘇毅所在的科技與數字出版處也是全國在這個方面的首創。
“而2011年全國數字出版產值將高達1000億元。”汕頭大學出版社社長胡開祥認為市場前景非?捎^。華閱數碼有兩款數字閱讀平臺“讀覽天下”以及中文名為“扎克”的ZAKER,而汕大出版社則擁有語義搜索技術的優勢。其中,“讀覽天下”除了iPad外,還支持安卓、Kindle、漢王、索尼等的閱讀器,用戶可以通過這個平臺下載各種合法出版物,目前已加盟的有1500種雜志、30000本圖書和上百家不同出版社。
2010年12月,“讀覽天下”推出基于iPad操作系統的免費閱讀軟件ZAKER。這款軟件支持用戶個性化信息搜索,能將互聯網資訊、報紙雜志等和微博聯系到一起并自動抓取到用戶的平板電腦上,再重新排版成類似電子雜志的形態。用戶還可以轉發或評論內容至微博。不過,與會人士也承認,目前國內的數字化閱讀產業發展還僅限于把書報刊的內容簡單轉為電子載體適用的形式,也就是內容沒有變化,僅做技術上的調整。“往往手機和互聯網的固有特性被忽略。”華閱數碼CEO陳遲認為。對此,胡開祥也表示“數字化出版和閱讀的最后贏家永遠是內容出版社,如著名的湯姆森公司”。蘇毅則認為:“數字出版前15年的發展過程中,一直都是技術為王,只有內容和技術共同拉動,才能真正發展。”
語義搜索的突破
正在受到關注的語義搜索技術,可能成為帶動內容突破的重要因素。對于大部分用戶來說,語義搜索依然陌生,這項技術正是一些IT巨頭密切關注的新戰場。曾經的王者、被蘋果和谷歌搶去風頭的微軟,已經在語義搜索這個方面搶得了一些先機—微軟此前推出了新一代搜索引擎Bing(必應)。
所謂語義搜索,通俗地解釋,就是搜索引擎需要越來越懂用戶的意圖,抓取用戶最想知道的網頁內容—除了文本,還有圖片、視頻等多媒體內容。
“我們把必應稱為"決策引擎",因為其用途特點在于能夠智能分析搜索目標。”微軟中國公關總監王巖對時代周報記者表示。“傳統的搜索是以關鍵詞為核心的,而語義搜索則是圍繞主題詞展開。所以搜索結果并一定因為文本里出現了最多搜索詞,而是根據主題意思展開的。”胡開祥解釋。在目前的搜索引擎市場里,谷歌遵循的是一條“客觀主義”的搜索路線,也就是不問評價者和用戶之間的關系,只根據內容所在網頁的技術權重進行篩選。而微軟選擇的語義搜索考慮人際關系,把用戶值得信任的人發布的信息在搜索結果中排序靠前。這已經有把“社交網絡”和“搜索引擎”混在一起的味道了。微軟早在2008年就購買了語義搜索引擎Powerset,開始在這個市場布局。
某種程度上,對語義搜索的爭奪將逐漸使目前的國際搜索引擎市場白熱化。2010年年底,調研機構comScore公布了美國搜索引擎當年11月的市場份額,谷歌依然是老大,微軟的bing還是排在雅虎之后做老三,市場份額為11.8%,但相對于谷歌和雅虎的略微下滑各0.1%,bing則有0.3%的小幅增長。
中國搜索引擎霸主百度也在10個月前推出“框計算”戰略,百度首席執行官李彥宏的宏偉構想是,通過語義分析預知用戶需求,比如說,當你輸入“5萬美元”時,將被帶到一個匯率換算網站;當輸入“北京上海”時,將出現一個航班清單—這些內容都將顯示在結果頁的一個方框中。
語義搜索與數字出版
拋開這些跨國公司的爭奪,對于數字出版行業來說,語義搜索技術是他們利用技術使內容升級的一個希望。
“通過語義搜索技術,我們可以對目前的微博內容進行梳理。”胡開祥進一步解釋,“大家都喜歡看微博,但是無效信息很多。比如我們想看經濟學家的經濟觀點,不想看到他的私生活,這時候語義搜索可以對微博內容進行篩選,把我們需要的內容分門別類歸好”。
同樣,用這個技術進行書本整理,也是盈利的重要手段。傳統的書本搜索只是將關鍵詞的位置搜索出來,語義搜索技術,可以從字詞句、篇章、語用和邏輯三個層面將文章的內涵分解出可以識別的結構性信息“碎片”,然后以“百科閱讀”、主題閱讀等形式呈現出來。
“我們對一本20萬字的書進行整合梳理,如果收1000元的費用,那么市場前景就相當廣泛。要知道,全國一年出版的書籍超過20萬種。”胡開祥這樣展望。
【點擊查看更多精彩內容】
相關新聞:
《數字印刷管理辦法》:鼓勵數字出版物
淘花解決數字出版渠道難題
2011亞太數字出版:出版業的數字化轉型
天津國家數字出版基地云計算中心將正式開放
“數字出版本身是廣東的強項,我們一直立足于成為這方面的全國標兵。”廣東省新聞出版局數字出版管理處處長、廣東數字出版產業聯合會執行副會長蘇毅接受時代周報記者采訪時難掩雄心。實際上,早在2010年,蘇毅就曾表示,成立廣東省數字出版產業聯合會是要進一步加強數字出版產業鏈上中下游的戰略合作。華閱數碼和汕頭大學出版社的合作無疑是其中的重要一步。
前景在于內容技術并濟
廣東數字出版產業起步較早,2008年全國數字出版總收入530億元,其中廣東占100億元;2009年全國預計達750億元,廣東占150億元。在去年第三屆中國數字出版博覽會上,廣東是獲獎最多的省份,并囊括了業界公認難度最大的“創新技術獎”過半獎項。蘇毅所在的科技與數字出版處也是全國在這個方面的首創。
“而2011年全國數字出版產值將高達1000億元。”汕頭大學出版社社長胡開祥認為市場前景非?捎^。華閱數碼有兩款數字閱讀平臺“讀覽天下”以及中文名為“扎克”的ZAKER,而汕大出版社則擁有語義搜索技術的優勢。其中,“讀覽天下”除了iPad外,還支持安卓、Kindle、漢王、索尼等的閱讀器,用戶可以通過這個平臺下載各種合法出版物,目前已加盟的有1500種雜志、30000本圖書和上百家不同出版社。
2010年12月,“讀覽天下”推出基于iPad操作系統的免費閱讀軟件ZAKER。這款軟件支持用戶個性化信息搜索,能將互聯網資訊、報紙雜志等和微博聯系到一起并自動抓取到用戶的平板電腦上,再重新排版成類似電子雜志的形態。用戶還可以轉發或評論內容至微博。不過,與會人士也承認,目前國內的數字化閱讀產業發展還僅限于把書報刊的內容簡單轉為電子載體適用的形式,也就是內容沒有變化,僅做技術上的調整。“往往手機和互聯網的固有特性被忽略。”華閱數碼CEO陳遲認為。對此,胡開祥也表示“數字化出版和閱讀的最后贏家永遠是內容出版社,如著名的湯姆森公司”。蘇毅則認為:“數字出版前15年的發展過程中,一直都是技術為王,只有內容和技術共同拉動,才能真正發展。”
語義搜索的突破
正在受到關注的語義搜索技術,可能成為帶動內容突破的重要因素。對于大部分用戶來說,語義搜索依然陌生,這項技術正是一些IT巨頭密切關注的新戰場。曾經的王者、被蘋果和谷歌搶去風頭的微軟,已經在語義搜索這個方面搶得了一些先機—微軟此前推出了新一代搜索引擎Bing(必應)。
所謂語義搜索,通俗地解釋,就是搜索引擎需要越來越懂用戶的意圖,抓取用戶最想知道的網頁內容—除了文本,還有圖片、視頻等多媒體內容。
“我們把必應稱為"決策引擎",因為其用途特點在于能夠智能分析搜索目標。”微軟中國公關總監王巖對時代周報記者表示。“傳統的搜索是以關鍵詞為核心的,而語義搜索則是圍繞主題詞展開。所以搜索結果并一定因為文本里出現了最多搜索詞,而是根據主題意思展開的。”胡開祥解釋。在目前的搜索引擎市場里,谷歌遵循的是一條“客觀主義”的搜索路線,也就是不問評價者和用戶之間的關系,只根據內容所在網頁的技術權重進行篩選。而微軟選擇的語義搜索考慮人際關系,把用戶值得信任的人發布的信息在搜索結果中排序靠前。這已經有把“社交網絡”和“搜索引擎”混在一起的味道了。微軟早在2008年就購買了語義搜索引擎Powerset,開始在這個市場布局。
某種程度上,對語義搜索的爭奪將逐漸使目前的國際搜索引擎市場白熱化。2010年年底,調研機構comScore公布了美國搜索引擎當年11月的市場份額,谷歌依然是老大,微軟的bing還是排在雅虎之后做老三,市場份額為11.8%,但相對于谷歌和雅虎的略微下滑各0.1%,bing則有0.3%的小幅增長。
中國搜索引擎霸主百度也在10個月前推出“框計算”戰略,百度首席執行官李彥宏的宏偉構想是,通過語義分析預知用戶需求,比如說,當你輸入“5萬美元”時,將被帶到一個匯率換算網站;當輸入“北京上海”時,將出現一個航班清單—這些內容都將顯示在結果頁的一個方框中。
語義搜索與數字出版
拋開這些跨國公司的爭奪,對于數字出版行業來說,語義搜索技術是他們利用技術使內容升級的一個希望。
“通過語義搜索技術,我們可以對目前的微博內容進行梳理。”胡開祥進一步解釋,“大家都喜歡看微博,但是無效信息很多。比如我們想看經濟學家的經濟觀點,不想看到他的私生活,這時候語義搜索可以對微博內容進行篩選,把我們需要的內容分門別類歸好”。
同樣,用這個技術進行書本整理,也是盈利的重要手段。傳統的書本搜索只是將關鍵詞的位置搜索出來,語義搜索技術,可以從字詞句、篇章、語用和邏輯三個層面將文章的內涵分解出可以識別的結構性信息“碎片”,然后以“百科閱讀”、主題閱讀等形式呈現出來。
“我們對一本20萬字的書進行整合梳理,如果收1000元的費用,那么市場前景就相當廣泛。要知道,全國一年出版的書籍超過20萬種。”胡開祥這樣展望。
【點擊查看更多精彩內容】
相關新聞:
《數字印刷管理辦法》:鼓勵數字出版物
淘花解決數字出版渠道難題
2011亞太數字出版:出版業的數字化轉型
天津國家數字出版基地云計算中心將正式開放
- 關于我們|聯系方式|誠聘英才|幫助中心|意見反饋|版權聲明|媒體秀|渠道代理
- 滬ICP備18018458號-3法律支持:上海市富蘭德林律師事務所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098