活動海報或者參考文件竟然是實體。或者體積巨大的檔案,AI 難以處理?買倨OCR軟件不划算,可以怎算?那你要看看今期教學了!現在的AI早已是多模態,聲音或者文字都難不到他們。
AI 圖片取字教學
【第零步:需要的工具】
-可以拍攝到清楚照片的手機 或/及 能進行基本操作的PC/MAC一台
– POE 免費或付費用戶都可以
示例照片
網頁是繒圖版比較小,但此照片原圖達到5M以上容量,直放AI能夠處理,基本上一般手機照片不要太巨大,能處理的機會是相當高,可以放心。
【第一步:準備好圖片】
1.1. 使用相機拍照,不用擔心,只要照片不是極限大,一舨而言都能處理。
1.2. 使用電腦將畫面或圖像CAPTURE出來,不會做的話,看這段介紹的快捷鍵
CHROME或部份行動裝置截取畫面的方法,可以參考以下三篇:
在Samsung 和Sony 的Android 手機上截取畫面
【第二步:用AI BOT進行視像分析】
今次也是使用POE,推介的BOT:
免費用戶:還是用CP值超高的 GPT-4o-Mini-128k (直按圖示到達)
付費用戶:CP值高的 Claude-3.5-Sonnet-200k (直按圖示到達)
Claude-3.5-Sonnet-200k
先給大家一個通用指令(PROMPT) 【請將圖片當中所有文字抽取出來,之後合理排版輸出】,不想用腦,COPY & PASTE就可以!
將推介的PROMPT接上,UPLOAD好圖片或即拍照片,馬上開始吧!
成功提取後到結束了,LLM始終有不確定性,加上圖片品貿,結果未必能100%,但花一分半分鐘,最少可以少打一半內容,不爽嗎?
【額外:不同AI BOT輸出結果比較】
GPT-4o-Mini-128k 抽取文字結果
Claude-3.5-Sonnet-200k 抽取文字結果
可以看到 Claude-3.5-Sonnet-200k 的結果更智能,當然,如果不想它那麼智能,可以直接使用PROMPT【輸出所有圖中文字】就可以。
另一種指令結果如下:
續會導記錄篇,畫面上的怎樣處理?
有看上篇會議記錄嗎?要一行一行COPY很痛苦?用這個解決吧!首先截取畫面,貼上,或加入,之後使用PROMPT【幫我提取字朔中的文字】,看結果吧?
更多AI心得,可以訂閱TechApple Whatsapp頻道,記得記得打開鈴鈴,單向傳訊,別人看不到你加頻,亦絕不會傳錯訊息,我們每天最多只發一條,絕不轟炸,請放心訂閱。每次1-2分鐘,看一個訊息,你就可以追上科技時代,AI時代!TechApple 誠意普及科技,為機構和NGO度身訂造AI工作坊,教學使用更強更有針對性的指令,更大限發揮工具功能,應對日常工作,有興趣可以WhatsApp聯絡我們 或電郵至 [email protected]!
【補充附錄:Windows 及 Mac 的 Mac 系統截圖操作簡表:】
Mac 和 PC 截圖方法對比
功能 | Mac | PC (Windows) |
---|---|---|
全螢幕截圖 | Command + Shift + 3 | PrtScn 鍵 |
選擇區域截圖 | Command + Shift + 4 | Windows 鍵 + Shift + S |
窗口截圖 | Command + Shift + 4,然後按空格鍵 | Alt + PrtScn |
截圖工具 | Command + Shift + 5 | Snipping Tool 或 Snip & Sketch |
截圖到剪貼板 | 加入 Control 鍵(如 Command + Control + Shift + 3) | PrtScn 或 Alt + PrtScn(自動到剪貼板) |
保存截圖 | 自動保存到桌面 | Windows 鍵 + PrtScn(保存到圖片文件夾) |