CAPTCHA是一種完全自動化的公共圖靈測試,解析資料用於區分電腦和人!在網站讓您了解實際內容之前,需要解決所有這些小難題和難題。
雖然驗證碼在正常的網頁瀏覽過程中可能會很麻煩,但在嘗試完成網頁抓取任務時,解析資料它們會變得真正令人煩惱。事實上,這就是他們的目的,但當您只是嘗試從不同的網站收集資訊時,它仍然不會讓您的生活變得更輕鬆。
那我們能做些什麼呢?這正是我們將在本文中討論的內容:解析資料有哪些類型的驗證碼以及如何以程式設計方式解決它們,特別注意reCAPTCHA和 hCaptcha
請繫好安全帶,準備好面對大量的紅綠燈
驗證碼有哪些不同類型?
最初,驗證碼非常簡單,巴哈馬電話號碼庫解析資料其特點是使用者必須在文字欄位中輸入稍微扭曲的文字字元圖像。
如果您輸入的文字與圖像匹配,解析資料則該網站認為它是由真人發送的。隨著時間的推移,OCR 變得越來越好,CAPTCHA 也變得更加複雜且難以解決。如今,驗證碼可以以以下變體形式呈現:
- 文字
- 使用複選框
- 基於影像
- 基於音訊
- 帶滑桿
- 3D 物體
- 數學計算
- 隱形且被動
文字
最常見的驗證碼類型之一是文本,解析資料它要求使用者破解圖像中的文本並提供正確的答案。谷歌在其第一個版本的 reCAPTCHA 中使用了這種方法來數位化書籍。
複選框
至少從使用者體驗的角度來看,解析資料複選框驗證碼可能是最簡單的驗證碼類型。用戶只需選中相應的框,就可以「確認」他不是機器人。確切的實作類型可能有所不同,解析資料從簡單的 HTML checkbox() 到涉及JavaScript和伺服器端請求的更複雜的實作。
複選框驗證碼的一個非常常見的變體是Google 自己的 reCAPTCHA服務的版本 2 :
使用此方法的另一個常見服務是Cloudflare with Turnstile:
圖片解析資料
可怕解析資料對吧?
是的,這又是Google的reCAPTCHA,它讓影像驗證碼變得有名。解析資料在這裡,用戶必須將圖像與特定任務相匹配,並在成功完成後獲得存取權限。
這種驗證碼非常有名,甚至還出現在xkcd 漫畫中。
聲音的
使用音訊驗證碼時,2024 年每個數位行銷人員應具備的技能使用者需要聆聽簡短的音訊片段並將單字翻譯成文字。
reCAPTCHA 提供此功能作為替代輔助解決方案,解析資料特別是對於視力不佳的人。
滑桿
滑桿驗證碼是圖形驗證碼的一種特殊形式,解析資料要求使用者將剪切影像(通常呈拼圖形狀)放置在原始影像的正確位置。
3D 物體
3D 物件是驗證碼的相當新的補充,007 數據通解析資料常會向您顯示場景中不同 3D 物件的選擇,以及有關如何選擇適當圖片或以某種方式設定場景的說明。
數學計算
數學驗證碼測試您的基本算術技能。解析資料他們要你回答一個基本的數學公式,要通過測試,你只要輸入正確的數字。