互聯(lián)網(wǎng)自動化程序已經(jīng)滲透到我們生活的方方面面!對此鄭州達內(nèi)特在網(wǎng)絡中整理了一些知識點,分享如下,希望可以幫助大家認知互聯(lián)網(wǎng)!
成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),吳橋企業(yè)網(wǎng)站建設(shè),吳橋品牌網(wǎng)站建設(shè),網(wǎng)站定制,吳橋網(wǎng)站建設(shè)報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,吳橋網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。互聯(lián)網(wǎng)目前已經(jīng)滲透到我們生活的方方面面,但它依然只是現(xiàn)實的物理世界在虛擬的網(wǎng)絡空間上按比特信息編碼后的投射。
所以只要定制相應的自動化程序便可以模仿人的行為,同時,因為機器速度更快且不知疲倦,它會被用于批量在論壇、網(wǎng)站、app 中發(fā)布營銷信息。而且,在監(jiān)管不足的情況下,利潤更高的行業(yè)往往底線更低,自動機器人發(fā)布的垃圾信息經(jīng)常也和賭 博、詐騙、色 情等灰色產(chǎn)業(yè)有關(guān)。一些自動化程序還會嘗試以“撞庫”的方式竊取用戶帳號、密碼,給網(wǎng)站帶來巨大的安全隱患。
于是,驗證碼應運而生。作為同樣的自動化程序,二維碼存在目的是區(qū)分用戶到底是機器人還是真實的人。
最常見的驗證碼便是自動生成的扭曲的文字和圖案,雖然它可以有效地識別出很大一部分自動化程序,但它對真人用戶的體驗并不好。而且隨著機器學習的發(fā)展,要破解它也越來越容易。
▲驗證碼風格的設(shè)計圖案
Google的驗證碼團隊有著各種創(chuàng)新試驗,比如創(chuàng)造性地把驗證碼用于紙質(zhì)典籍數(shù)字化。另外除了扭曲文字、圖片的主流路線之后,Google的團隊還嘗試了新的思路,利用追蹤用戶的點擊行為等來識別是否真人操作。用戶只需要點擊“我不是機器人”的復選框便可驗證。
在最新版本的Google驗證碼reCAPTCHA v3中,你甚至什么都不用做,系統(tǒng)就在悄悄核驗當前的用戶是不是機器人。技術(shù)正在讓“驗證碼”越來越隱形,人類不必再為了自證身份去做“反向圖靈測試”,然而這種進步也帶來了不少新的問題。
初代驗證碼CAPTCHA:歪歪扭扭的文字
2000年,從杜克大學數(shù)學系畢業(yè),來到卡內(nèi)基梅隆大學讀計算機科學博士的路易斯·馮·安(Luis von Ahn)和導師一起提出了驗證碼的概念,全稱是全自動區(qū)分計算機和人類的公開圖靈測試(英語:Completely Automated Public Turing test to tell Computers and Humans Apart,簡稱 CAPTCHA)。
圖靈測試由計算機先驅(qū)人物,“人工智能之父”阿蘭·圖靈提出,以一臺計算機能和人類對話而不被識別出是機器人為通過圖靈測試基準。驗證碼也是圖靈測試的一種,但它的目的不是為了創(chuàng)造AI,而只是為了識別真實的人類用戶。
一種最常見的驗證碼是由算法生成的扭曲的文字,這么做是為了防止被光學字符識別程序(OCR)自動識別出來。
有一些方法是在字母上加一條曲線或?qū)⒉煌淖帜腐B在一起,也有添加復雜背景的方式。
也有圖片驗證碼,要求用戶識別圖片的物體,以及把缺失的部分拖到正確的位置和拼圖等。
但不管形式如何,這些驗證碼有一個共同的原則:就是要讓人類很容易識別,卻對計算機來說非常困難。一些研究者認為,為避免 CAPTCHA過難而使網(wǎng)站損失用戶,通常要求人類用戶通過測試的時間小于30秒,用戶通過率大于90%。
還有一個不被普通人知道的點,驗證碼被稱為一種“圖靈測試”,所以它在設(shè)計之初就有促進人工智能發(fā)展的初衷。
根據(jù)定義,驗證碼的算法必須公開,這樣做的目的是為了讓破解驗證碼的過程是在解決對應的人工智能問題,例如圖像識別、準確度更高的OCR等,破解者不必花費心思通過逆向工程推演算法。
利用驗證碼將紙質(zhì)典籍數(shù)字化
目前驗證碼已經(jīng)被廣泛用于各大網(wǎng)站、app中,有數(shù)據(jù)顯示,這項技術(shù)在推出后的短短五年內(nèi),每天就有2億個驗證碼在被使用。
很快,驗證碼發(fā)明者提出一個新的項目reCAPTCHA,主要用于把互聯(lián)網(wǎng)出現(xiàn)前的紙質(zhì)典籍數(shù)字化。思路是這樣的:驗證碼系統(tǒng)會向用戶出示兩個單詞,第一個是正常的自動生成扭曲文字,另外一個則來自紙質(zhì)典籍的掃描版,來自掃描版的文字通常因為年代久遠、或是紙上有污點等原因而難以被OCR程序識別。
因此,當用戶輸入驗證碼時,只要第一個單詞輸入正確就可以被判別為人類,輸入的第二個單詞只是“義務勞動”。這是因為系統(tǒng)會默認第二個單詞輸入是正確的,輸入結(jié)果只是會與其他用戶的輸入結(jié)果進行對比,如果多名用戶的答案一致,這個詞的數(shù)字化就完成了。
也許你會認為這樣一個一個詞的識別與龐大的待數(shù)字化的典籍相比,根本起不了多大作用,然而在推出之初,reCAPTCHA便能錄入3000萬個字符。2011年,它已經(jīng)完成了全部的《紐約時報》數(shù)字化的工作,這份從1851年開始出版的老報紙有大量純紙質(zhì)版的內(nèi)容。
2009 年,Google看上了這個項目的價值,并出手收購了reCAPTCHA,同時也被Facebook、Twitter、CNBC等使用。在幫助這些流量大的網(wǎng)站抵御自動化程序騷擾的同時,Google圖書中難以被自動識別的掃描版的古老典籍同樣借助reCAPTCHA得以數(shù)字化。
另外,reCAPTCHA還被用于幫助機器學習系統(tǒng)提高圖像識別率,運作原理和典籍數(shù)字化的方法是一樣,用機器難以辨別的門牌號、貓狗照片拿來當做驗證碼供人類識別。
與此同時,用戶實際上還在幫機器學習系統(tǒng)標注訓練集,所以,強大的AlphaGo背后的人工智能技術(shù),可能早就有你的功勞。
NoCAPTCHA:不用輸入字符的驗證方式
Google在收購reCAPTCHA后,對它進行了以Google的方式改進。
在2014年,Google推出了新的驗證碼系統(tǒng)——NoCAPTCHA reCAPTCHA,雖然名字有點拗口,但依然是個驗證系統(tǒng),其核心是不需要輸入驗證碼,用戶只需要點擊一個“我不是機器人”的復選框,Google就能判別你是不是真正的人類。
reCAPTCHA的口號也從“別發(fā)垃圾信息了,讀點書吧”(Stop Spam. Read Books),變成了驗證碼最初的目的“對人類簡單,對機器人困難”(Easy on Humans, Hard on Bots)。
NoCAPTCHA跟蹤用戶點擊驗證框之前、當時和之后的行為,比如在網(wǎng)頁上花費的時間,從而來判斷是否是人為操作。
假如你被誤判為機器人,還有一個“申訴”的機會,和圖片驗證一樣,從一堆圖片中選出正確的目標。
使用reCAPTCHA v3的網(wǎng)站會在網(wǎng)站的每個頁面放入reCAPTCHA v3代碼,而不只是在登錄頁面。reCAPTCHA系統(tǒng)會跟蹤用戶的所有瀏覽行為進行分析。
就這樣,Google 可以獲得幾乎用戶的所有行為。Google也確認,用戶使用的硬件信息即設(shè)備上的軟件會被發(fā)送回 Google服務器,但它表示,獲得的結(jié)果“只用于分析用戶行為,不用于個性化廣告推薦”。不過,隱私都被掌握了的事實就擺在這里,你想更快捷被驗證還是以隱私換取快捷呢?
網(wǎng)頁標題:我們需要選擇互聯(lián)網(wǎng)自動技術(shù)嗎-創(chuàng)新互聯(lián)
鏈接URL:http://www.rwnh.cn/article0/dcpjoo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應式網(wǎng)站、ChatGPT、移動網(wǎng)站建設(shè)、App開發(fā)、用戶體驗、營銷型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容