展會信息港展會大全

AI-大模型的可行性驗證
來源:互聯(lián)網   發(fā)布日期:2024-07-01 14:14:36   瀏覽:4297次  

導讀:大模型作為當前的前沿技術,有著強大的計算能力和復雜的數據處理能力,但是,面對大規(guī)模數據和高復雜度任務,模型的可行性如何?本文希望為大家提供了一個全面的視角,揭示了AI大模型在理論和實踐中的潛力。 隨著信息技術的飛速發(fā)展,人工智能(AI)逐漸從科...

大模型作為當前的前沿技術,有著強大的計算能力和復雜的數據處理能力,但是,面對大規(guī)模數據和高復雜度任務,模型的可行性如何?本文希望為大家提供了一個全面的視角,揭示了AI大模型在理論和實踐中的潛力。

隨著信息技術的飛速發(fā)展,人工智能(AI)逐漸從科幻走向現(xiàn)實,成為驅動現(xiàn)代社會變革的核心力量。

AI大模型作為這一領域的前沿技術,憑借其強大的計算能力和復雜的數據處理能力,正引領著技術創(chuàng)新的潮流。

然而,面對大規(guī)模數據和高復雜度任務,這些模型的可行性和有效性究竟如何?

本文希望為大家提供了一個全面的視角,揭示了AI大模型在理論和實踐中的潛力。

那么今天我們要做的是基于大模型進行證件過期,來進行實現(xiàn)思路構思和選型。

一、目標

基于身份證圖片判斷其是否過期。

二、OCR技術

OCR(Optical Character Recognition,光學字符識別)技術可以將各種票據、報刊、書籍、文稿及其他印刷品的文字通過掃描轉化為圖像信息,并利用文字識別技術將圖像信息轉化為可使用的文本。這項技術可以幫助我們從身份證圖片中提取出有效的文字信息,用于后續(xù)的過期判斷。

OCR:OCR技術是光學字符識別的縮寫(Optical Character Recognition),是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其他印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的文本的計算機輸入技術掃描圖片轉文字。

第一步:數據集準備

數據集準備-日常生活中首先我們收集身邊人員。

#手機內容:身份證、居住證等符合場景要求的身份信息:例如身份證、駕駛證、護照、居住證、港澳通行證等。

#收集數量:10-30張

“在收集到足夠的數據后,接下來我們要進行數據匯總,以便后續(xù)的處理和分析。”

第二步:數據匯總

數據匯總方便我們后續(xù)對數據質量評價和應用,制作一個Excel表格,格式如下

首先我們可以將圖片上傳到云盤,獲取圖片鏈接。第二列為OCR結果復制粘貼

進去。

第三步:OCR提取

OCR 內容提取可行性驗證,并不需要開發(fā)代碼有界面,可操作交互的 OCR 產品即可騰訊 OCR:https://cloud.tencent.com/product/ocr

第四步:大預言模型能力提取所需的關鍵信息

注釋:“Prompt工程是一種設計和改進AI提示的方法,以提高AI的表現(xiàn)。”

Prompt Engineering 是一種人工智能(AI)技術,它通過設計和改進 AI 的 prompt來提高 AI 的表現(xiàn)。Prompt Engineering的目標是創(chuàng)建高度有效和可控的 AI 系統(tǒng),使其能夠準確、可靠地執(zhí)行特定任務。

因為人類的語言從根本上說是不精確的,目前機器還沒法很好地理解人類說的話,所以才會出現(xiàn) Prompt 工程這個技術。

如果你是產品設計師,或者研發(fā)人員,你可以通過它來設計和改進AI系統(tǒng)的提示,從而提高AI系統(tǒng)的性能和準確性,為用戶帶來更好的AI體驗。

第五步:迭代調優(yōu)

輸入OCR內容查看結果-調整Prompt調整模型/參數最后統(tǒng)一輸出所有。

第六步:完善數據

把第三列輸出結果補充進去,人工判斷第四列是True正確還是False錯誤

第七步:整體效果評估

匯總樣本統(tǒng)計 :樣本數20

1. 精確率:95%

2. 召回率:100

精確率:對預測結果為正的樣本中實際正確的個數

召回率:實際正樣本中有多少被預測了回來

例如:面前有很多只狗和貓,扔一只骨頭出去希望狗能跑過來精確率就是所有跑回來的動物中有多少只是狗,10只跑回來,其中有8只狗,精確率80%在所有的動物中有20只狗,召回率就是8/20.

綜上所述,通過《AI-大模型的可行性驗證》,我們深入探討了如何利用AI大模型和OCR技術來判斷身份證是否過期。整個過程包括數據收集、OCR提娶模型應用及結果評估,展示了AI大模型在處理復雜數據任務中的優(yōu)異表現(xiàn)。

在實際應用中,我們成功實現(xiàn)了高精度的身份證過期判斷。在測試的20個樣本中,我們達到了95%的精確率和100%的召回率,充分證明了AI大模型的潛力。例如,通過OCR技術,我們準確提取了身份證上的有效期信息,并通過大語言模型的分析,準確判斷出身份證是否過期。

然而,在這個過程中也遇到了一些挑戰(zhàn)。例如,部分OCR結果存在誤識別問題,特別是在處理模糊或低質量圖片時。此外,Prompt工程的設置和模型參數的調優(yōu)也需要不斷嘗試和優(yōu)化,以獲得最佳的判斷結果。面對這些挑戰(zhàn),我們通過不斷迭代和改進,逐步提高了系統(tǒng)的準確性和可靠性。

盡管如此,我們仍需繼續(xù)優(yōu)化技術,解決在圖像質量和識別準確性方面的不足,并加強對AI模型的道德審查和安全性測試。未來,隨著技術的進一步發(fā)展,AI大模型有望在更多領域實現(xiàn)突破,帶來更多創(chuàng)新和便利。

本文由 @李雪亮 投稿發(fā)布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協(xié)議

贊助本站

人工智能實驗室

相關熱詞: AI- 大模型 可行性 驗證

AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港