方正阿帕比榮獲第九屆數博會兩項大獎
8 月 21 日-8 月 25 日,第九屆中國數字出版博覽會暨中國數字內容服務大會(以下簡稱“數博會”)在京舉辦,六大展區(qū)數十家參展商共同為大眾展示我國數字出版領域的新業(yè)態(tài)、新成果,獻禮祖國七十華誕。
8 月 23 日,在本屆數博會的頒獎典禮上,方正阿帕比憑借著在數字出版領域的重要貢獻以及在展會中亮眼的表現,榮獲“2018-2019 年度數字出版創(chuàng)新技術”以及“優(yōu)秀展示單位”兩項大獎。
8 月 23 日,在本屆數博會的頒獎典禮上,方正阿帕比憑借著在數字出版領域的重要貢獻以及在展會中亮眼的表現,榮獲“2018-2019 年度數字出版創(chuàng)新技術”以及“優(yōu)秀展示單位”兩項大獎。

方正阿帕比榮獲第九屆中國數字出版博覽會“2018-2019 年度數字出版創(chuàng)新技術”圖為獲獎獎牌和榮譽證書
方正阿帕比榮獲第九屆中國數字出版博覽會“優(yōu)秀展示單位”圖為獲獎獎牌和榮譽證書
榮譽是表揚,是肯定,更是對未來的激勵
沒有哪個行業(yè)是一成不變的,科技的發(fā)展為個人的生活和工作帶來了太多的便利和捷徑,但對企業(yè)來講,每一次的科技創(chuàng)新帶來的都是挑戰(zhàn)??萍嫉睦顺毕?,考驗的就是企業(yè)的創(chuàng)新力和對市場方向的把控力。
知識是永恒的,但知識的承載工具卻是隨著時間而改變的,從龜背竹簡到紙質書籍是知識傳承的一次偉大創(chuàng)舉,而從紙質書籍到計算機則是一次劃時代的革命。當今的知識服務,要求的已經不單是知識的存儲,而是要求知識的智能化整合,精準的輸出到應用。

方正阿帕比智能問答技術
隨著數字化技術的發(fā)展,各大出版社已經陸續(xù)出版了大量的數字圖書。這些數字圖書具有內容系統(tǒng)性、全面性、權威性等特點,是人類各種知
識的系統(tǒng)性闡述,如何快速的從書中查找到用戶感興趣的知識或問題答案,是擺在數字出版領域的一個難題。本技術采用深度學習技術對圖書內容進行閱讀理解,在此基礎上對用戶提出的問題進行邏輯推理和解答。
智能問答技術大概分為三類:一是以文本特征為基礎的早期智能問答, 該技術需要人工定義文本特征,缺乏對語義層次的學習能力,答案的準確率低。二是基于知識庫的問答技術,該技術依賴知識庫的準確性和全面性,建立知識庫是一個復雜的工程,投入成本較高。三是基于文本理解的問答技術,該技術通過基于 AI 閱讀理解技術的圖書內容問答技術, 該技術優(yōu)點是投入成本低,不需要太多的人工干預,搜索的答案比較全面,相相對于基于知識庫的問答技術來說,該技術邏輯推理能力弱,答案的準確性受限于文本的質量等。
基于圖書內容閱讀理解的問答技術的大概步驟如下: 一、對圖書內容進行版面理解和文本提??;
二、圖書文本內容進行 AI 閱讀理解,提取語義特征;
三、對用戶的問題進行理解,理解用戶的意圖和問題的類型,形成語義特征;
四、進行語義特征匹配,從圖書內容中提取答案并進行推理; 五、以自然語言的方式進行答案合成并返回給用戶。
對圖書內容進行版面理解用到了深度學習相關技術,理解圖書排版布局、版心位置、段落關系、文本順序、圖文位置、表格公式等信息,正確的還原圖書的內容。
智能問答技術大概分為三類:一是以文本特征為基礎的早期智能問答, 該技術需要人工定義文本特征,缺乏對語義層次的學習能力,答案的準確率低。二是基于知識庫的問答技術,該技術依賴知識庫的準確性和全面性,建立知識庫是一個復雜的工程,投入成本較高。三是基于文本理解的問答技術,該技術通過基于 AI 閱讀理解技術的圖書內容問答技術, 該技術優(yōu)點是投入成本低,不需要太多的人工干預,搜索的答案比較全面,相相對于基于知識庫的問答技術來說,該技術邏輯推理能力弱,答案的準確性受限于文本的質量等。
基于圖書內容閱讀理解的問答技術的大概步驟如下: 一、對圖書內容進行版面理解和文本提??;
二、圖書文本內容進行 AI 閱讀理解,提取語義特征;
三、對用戶的問題進行理解,理解用戶的意圖和問題的類型,形成語義特征;
四、進行語義特征匹配,從圖書內容中提取答案并進行推理; 五、以自然語言的方式進行答案合成并返回給用戶。
對圖書內容進行版面理解用到了深度學習相關技術,理解圖書排版布局、版心位置、段落關系、文本順序、圖文位置、表格公式等信息,正確的還原圖書的內容。
圖書內容閱讀理解用到了深度學習的字嵌入、詞嵌入等模型,使用 BERT 網絡模型進行文本特征提取。對用戶問題的理解方面,需要用到知識庫對用戶提問的問題進行同義詞、近義詞、縮寫詞、上下位詞等進行擴展, 對用戶提問問題進行分類,準確理解用戶的意圖。
該技術已經應用在新聞出版研究院研究的版權知識問答項目系統(tǒng)上,該系統(tǒng)集成了出版社正規(guī)出版的 10 萬本圖書,通過閱讀理解技術能夠從10 萬本圖書正文中搜索到用戶需要的答案,節(jié)省用戶查找答案的時間, 發(fā)揮圖書作為知識的載體的作用,發(fā)揮作者和編輯的創(chuàng)造價值,挖掘人類知識的價值等。
智能化,數字出版的未來
隨著科技的進步,人們獲取內容的方式也變得豐富起來,多樣化的文化傳播方式滿足不同人群的需求??萍际窃诓粩噙M步的,知識服務的智能化早已是大勢所趨,而這對擁有強大內容生產運作能力和強有力科技支撐的的方正阿帕比而言,這是一次良機。用科技的力量推動文化深遠傳播,實現終端的智能化、多元化閱讀。方正阿帕比已經為建設全新的知識服務產業(yè)鏈做好準備。