展會(huì)信息港展會(huì)大全

超越 OCR,谷歌 AI 技術(shù) InkSight 可精準(zhǔn)識(shí)別手寫文字
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-11-06 08:33:11   瀏覽:23次  

導(dǎo)讀:IT之家 11 月 5 日消息,Google Research 展示了一種使用人工智能讀取手寫內(nèi)容的新方法,名為 InkSight 的系統(tǒng)能夠直接從手寫文字的圖片中提取出數(shù)字文本,無需任何中間設(shè)備。傳統(tǒng)的手寫文字識(shí)別技術(shù)主要依賴于光學(xué)字符識(shí)別 (OCR),但這種方法在處理復(fù)雜背景、模糊不清或低光照條件下的手寫文字時(shí)往往表現(xiàn)不佳。InkSight 則采用了不同的思路,通過模仿人類學(xué)習(xí)閱讀的過程,即通 ......

IT之家 11 月 5 日消息,Google Research 展示了一種使用人工智能讀取手寫內(nèi)容的新方法,名為 InkSight 的系統(tǒng)能夠直接從手寫文字的圖片中提取出數(shù)字文本,無需任何中間設(shè)備。

超越 OCR,谷歌 AI 技術(shù) InkSight 可精準(zhǔn)識(shí)別手寫文字

傳統(tǒng)的手寫文字識(shí)別技術(shù)主要依賴于光學(xué)字符識(shí)別 (OCR),但這種方法在處理復(fù)雜背景、模糊不清或低光照條件下的手寫文字時(shí)往往表現(xiàn)不佳。InkSight 則采用了不同的思路,通過模仿人類學(xué)習(xí)閱讀的過程,即通過不斷地重寫文本,來學(xué)習(xí)整個(gè)單詞的外觀和含義。這需要研究人員訓(xùn)練 AI 模型,使其能夠識(shí)別和模仿人類的手寫風(fēng)格。

超越 OCR,谷歌 AI 技術(shù) InkSight 可精準(zhǔn)識(shí)別手寫文字

InkSight 在處理復(fù)雜場(chǎng)景時(shí)表現(xiàn)更為出色,例如當(dāng)照片光線昏暗、文本部分遮擋或背景干擾時(shí),InkSight 能夠更準(zhǔn)確地識(shí)別手寫文字。研究人員發(fā)現(xiàn),人類能夠閱讀 InkSight 生成的文本描摹的準(zhǔn)確率高達(dá) 87%,其中三分之二的描摹結(jié)果與真實(shí)手寫幾乎無法區(qū)分。

對(duì)于喜歡手寫的人來說,InkSight 具有巨大的潛力。想象一下,只需將手寫筆記拍攝照片,即可立即將其轉(zhuǎn)換為可搜索的數(shù)字文本。對(duì)于那些字跡潦草的人來說,InkSight 可以將難以辨認(rèn)的手寫內(nèi)容轉(zhuǎn)化為清晰、準(zhǔn)確的打印文本。

從更廣闊的視角來看,這項(xiàng)技術(shù)對(duì)于破譯和和將幾個(gè)世紀(jì)以來的手寫文本轉(zhuǎn)換為數(shù)字形式具有重要意義。即使對(duì)于那些數(shù)字化程度較低的語(yǔ)言,InkSight 也能幫助保護(hù)手寫遺產(chǎn),并為這些語(yǔ)言的數(shù)字化訓(xùn)練提供更多資源。

IT之家注意到,谷歌并不是唯一一家致力于開發(fā)手寫識(shí)別 AI 工具的公司。亞馬遜的 Kindle Scribe 電子閱讀器也具備將手寫筆記轉(zhuǎn)換為可讀文本的功能。此外,Goodnotes 等數(shù)字筆記應(yīng)用也推出了手寫識(shí)別和編輯功能,可以將手寫文字轉(zhuǎn)換為可編輯的數(shù)字文本。

贊助本站

相關(guān)熱詞: google ocr 文本 ink

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港