從優秀到卓越，玩瞳影象識別演算法的現狀與未來

今年暑假，眾多的兒童機器人給孩子們帶了全新AI繪本輔助閱讀體驗，“這個神奇的功能是怎麼實現的呢？”在整個AI繪本輔助閱讀功能中，影象識別演算法是其中最為關鍵的技術之一。

早在去年這個時候，玩瞳VisionTalk的影象識別演算法橫空出世，經過一年的鑽研和發展，到如今已經身經百戰，贏得了眾多客戶的信任和良好口碑。

從繪本識別到書本識別——VisionTalk的影象識別演算法

經過一年的打磨和成長，玩瞳的影象識別演算法已在市場上處於領先地位，其特點可以概括為：識別精準，響應快速，容量超大，易於擴充套件，持續迭代。

今天我們就從更專業的角度來看看玩瞳VisionTalk的AI慧讀平臺中的影象識別演算法。

1、識別精準

精準魯棒的識別，支援不同的硬體結構和不同的使用場景。我們模擬使用者在各種使用場景對各種主流繪本和K12書籍進行了充分的測試。這些場景包括辦公室，客廳，彩色兒童房，檯燈下，陽臺，商場等。

對於玩瞳推薦的硬體結構，識別準確率達到了驚人的99.5%。對於一般性裝置，如各式各樣的手機和平板，識別準確率依然高達98%。

2、響應快速

0.2秒的超快速識別速度給使用者一種秒翻識別的體驗。為了在整個系統上達到如此快的響應速度，我們主要做了以下三點優化：

a、直接優化雲端演算法的識別速度，尤其是在大併發下的識別速度。當前玩瞳的客戶眾多，也給我們的識別服務帶來了巨大的壓力，但經過持續不斷的演算法速度優化，我們的響應速度依然穩定快速。

b、對待傳輸的影象進行了極致的壓縮，減小網路傳輸的資料量。同時優化雲端演算法，使其能穩定識別壓縮後較模糊的影象。

c、大力提高識別演算法的魯棒性，使其能穩定識別翻頁過程中的遮擋影象，從而準確地預測出使用者即將翻到的頁面，最終達到翻書後即開始進行語音播放的效果。

3、容量超大

超大容量雲端相簿，當前已經支援約5萬本繪本，未來很快將超過10萬本。支援更多的繪本看似只需要製作更多的內容，實際上也需要準確快速的影象識別演算法支撐。

當影象庫變大後，一般來說識別準確率和速度都會受到影響。但從當前我們的模擬測試來看，10萬本的資料量還遠未觸控到識別演算法的瓶頸。

4、易於擴充套件

玩瞳將整體考慮離線訓練演算法和線上識別演算法的特點，設計合理的影象模型結構，不僅支援快速的圖書訓練和增量部署，而且在共享玩瞳公共繪本庫的同時支援使用者自定義私有繪本庫。

影象識別演算法的未來發展

現階段，玩瞳的影象識別演算法已經在市場上得到驗證，在業界處於遙遙領先的地位，贏得了眾多客戶良好的口碑。在未來的N年裡，玩瞳依然會持續不斷的迭代優化我們的影象識別演算法。

影象識別演算法即將迎來下一個突破：顯著提升以文字為主書籍的識別準確率。該突破帶來的意義將是書籍教輔的準確快速識別。

針對以文字為主的這類書籍影象，由於不同硬體的光學成像、影象解析度限制、以及演算法原理本身等各方面的原因，導致了目前市場上翻讀應用中幾乎所有的影象識別演算法失效。玩瞳自主研發的文字影象識別演算法體系，對於最困難的這類影象的識別現已取得重大突破，已經將競爭對手遠遠的甩在身後。

玩瞳VisionTalk持續致力於AI視覺技術賦能兒童教育，將我們的解決方案應用在更豐富的互動模式上，滿足客戶更加個性化的需求，玩瞳的影象識別演算法必將從優秀走向卓越。

深圳市玩瞳科技有限公司VisionTalk成立於2015年，是一家經深圳市政府認證的高新技術企業。公司專注於實體學習桌面的視覺影象分析，並應用於機器輔助的閱讀、作業和學習。

公司目前擁有數十項各類專利，並擁有全球最大的兒童出版物影象訓練庫。公司新推出的“智慧慧讀平臺”賦能產業鏈，低成本、高效率、個性化地幫助企業開發或升級閱讀機器人。已經成功在故事機/機器人、兒童出版、兒童內容等行業得到應用。

清秀吧