
Google已經宣布,它現在將開始掃描文件,包括在其搜索結果,需要大量的處理能力和先進的圖像識別技術。Google為 "掃描文件" 編索引,採用光學字符識別 (OCR ) 技術,將照片轉換成文本。
過去Google試圖為 "掃描文件" 編索引,但通常只搜索文件標題和附近的數據,而不是文件的內容。從現在開始,Google搜索將包括文件的內容。
這種技術已經存在了相當長的一段時間,但準確度一直是一個問題,即Google解決這個問題,對內容更徹底的搜索。
下面是一個例子 (第一次結果是,掃描的文件):
鋁合金檢修線路
欲了解更多,
請在這裡。
相關連結:
http://www.techcrunch.com/2008/10/30/google-now-indexes-scanned-documents/