清秀吧

位置:首頁 > 享受生活 > 家居生活

從優秀到卓越,玩瞳影象識別演算法的現狀與未來

今年暑假,眾多的兒童機器人給孩子們帶了全新AI繪本輔助閱讀體驗,“這個神奇的功能是怎麼實現的呢?”在整個AI繪本輔助閱讀功能中,影象識別演算法是其中最為關鍵的技術之一。

從優秀到卓越,玩瞳影象識別演算法的現狀與未來

早在去年這個時候,玩瞳VisionTalk的影象識別演算法橫空出世,經過一年的鑽研和發展,到如今已經身經百戰,贏得了眾多客戶的信任和良好口碑

從繪本識別到書本識別——VisionTalk的影象識別演算法

經過一年的打磨和成長,玩瞳的影象識別演算法已在市場上處於領先地位,其特點可以概括為:識別精準,響應快速,容量超大,易於擴充套件,持續迭代。

今天我們就從更專業的角度來看看玩瞳VisionTalk的AI慧讀平臺中的影象識別演算法。

1、識別精準

精準魯棒的識別,支援不同的硬體結構和不同的使用場景。我們模擬使用者在各種使用場景對各種主流繪本和K12書籍進行了充分的測試。這些場景包括辦公室,客廳,彩色兒童房,檯燈下,陽臺,商場等。

對於玩瞳推薦的硬體結構,識別準確率達到了驚人的99.5%。對於一般性裝置,如各式各樣的手機和平板,識別準確率依然高達98%。

2、響應快速

0.2秒的超快速識別速度給使用者一種秒翻識別的體驗。為了在整個系統上達到如此快的響應速度,我們主要做了以下三點優化:

a、直接優化雲端演算法的識別速度,尤其是在大併發下的識別速度。當前玩瞳的客戶眾多,也給我們的識別服務帶來了巨大的壓力,但經過持續不斷的演算法速度優化,我們的響應速度依然穩定快速。

b、對待傳輸的影象進行了極致的壓縮,減小網路傳輸的資料量。同時優化雲端演算法,使其能穩定識別壓縮後較模糊的影象。

c、大力提高識別演算法的魯棒性,使其能穩定識別翻頁過程中的遮擋影象,從而準確地預測出使用者即將翻到的頁面,最終達到翻書後即開始進行語音播放的效果。

3、容量超大

超大容量雲端相簿,當前已經支援約5萬本繪本,未來很快將超過10萬本。支援更多的繪本看似只需要製作更多的內容,實際上也需要準確快速的影象識別演算法支撐。

當影象庫變大後,一般來說識別準確率和速度都會受到影響。但從當前我們的模擬測試來看,10萬本的資料量還遠未觸控到識別演算法的瓶頸。

4、易於擴充套件

玩瞳將整體考慮離線訓練演算法和線上識別演算法的特點,設計合理的影象模型結構,不僅支援快速的圖書訓練和增量部署,而且在共享玩瞳公共繪本庫的同時支援使用者自定義私有繪本庫。

影象識別演算法的未來發展

現階段,玩瞳的影象識別演算法已經在市場上得到驗證,在業界處於遙遙領先的地位,贏得了眾多客戶良好的口碑。在未來的N年裡,玩瞳依然會持續不斷的迭代優化我們的影象識別演算法。

影象識別演算法即將迎來下一個突破:顯著提升以文字為主書籍的識別準確率。該突破帶來的意義將是書籍教輔的準確快速識別。

針對以文字為主的這類書籍影象,由於不同硬體的光學成像、影象解析度限制、以及演算法原理本身等各方面的原因,導致了目前市場上翻讀應用中幾乎所有的影象識別演算法失效。玩瞳自主研發的文字影象識別演算法體系,對於最困難的這類影象的識別現已取得重大突破,已經將競爭對手遠遠的甩在身後。

玩瞳VisionTalk持續致力於AI視覺技術賦能兒童教育,將我們的解決方案應用在更豐富的互動模式上,滿足客戶更加個性化的需求,玩瞳的影象識別演算法必將從優秀走向卓越。

深圳市玩瞳科技有限公司VisionTalk成立於2015年,是一家經深圳市政府認證的高新技術企業。公司專注於實體學習桌面的視覺影象分析,並應用於機器輔助的閱讀、作業和學習。

公司目前擁有數十項各類專利,並擁有全球最大的兒童出版物影象訓練庫。公司新推出的“智慧慧讀平臺”賦能產業鏈,低成本、高效率、個性化地幫助企業開發或升級閱讀機器人。已經成功在故事機/機器人、兒童出版、兒童內容等行業得到應用。