2016-08-10 分類: 網站建設
語音搜索的經驗教訓
成都網站建設在谷歌家跑了1000次搜索,以找出語音答案與桌面答案的區(qū)別。包括特色片段和一些谷歌家庭復活節(jié)彩蛋數據。
谷歌家居是谷歌搜索生態(tài)系統的延伸,這并不奇怪。家正試圖回答越來越多的問題,從搜索結果中得出這些答案。在搜索和語音答案之間的特色片段越來越清晰的連接。
例如,假設一只刺猬在你的房子里游蕩,你自然會發(fā)現自己在想你應該喂它什么。你可以搜索“刺猬吃什么?”在桌面上,您會看到如下的功能片段:
假設你正在為一個陌生的刺猬,在你的桌面搜索可能是不實際的,所以你問谷歌:“好吧,谷歌家的刺猬吃什么?”聽到以下:
谷歌的家庭線索與歸因于方舟野生動物(因為語音應答沒有直接鏈接),然后重復短版的桌面片段。這兩個答案之間的聯系,我希望,顯而易見。
大型網站的分層架構及物理服務器的分布式部署使得位于不同層次的服務器具有不同的可用性特點。關閉服務或者服務器宕機時產生的影響也不相同,高可用的解決方案也差異甚大。
位于應用層的服務器通常為了應對高并發(fā)的訪問請求,會通過負載均衡設備將一組服務器組成一個集群共同對外提供服務,當負載均衡設備通過心跳檢測等手段監(jiān)控到某臺應用服務器不可用時,就將其從集群列表中剔除,并將請求分發(fā)到集群中其他可用的服務器上,使整個集群保持可用,從而實現應用高可用。
位于服務層的服務器情況和應用層的服務器類似,也是通過集群方式實現高可用,只是這些服務器被應用層通過分布式服務調用框架訪問,分布式服務調用框架會在應用層客戶端程序中實現軟件負載均衡,并通過服務注冊中心對提供服務的服務器進行心跳檢測,發(fā)現有服務不可用,立即通知客戶端程序修改服務訪問列表,剔除不可用的服務器。
位于數據層的服務器情況比較特殊,數據服務器上存儲著數據,為了保證服務器宕機時數據不丟失,數據訪問服務不中斷,需要在數據寫入時進行數據同步復制,將數據寫入多臺服務器上,實現數據冗余備份。當數據服務器宕機時,應用程序將訪問切換到有備份數據的服務器上。
Anecdotally,這是一個模式,我們看到經常在谷歌的家,但如何一致呢?谷歌如何處理其他格式(包括列表和表格)的特色片段?谷歌家庭的一些問題與桌面搜索相比有著完全不同的答案嗎?
方法(10K --> 1K)
為了找到這些問題的答案,我需要從一組相當大的搜索開始,這些搜索很可能以特色片段的形式生成答案。我的同事Russ Jones拿出一套大約10000熱門搜索開始疑問詞(誰,什么,哪里,為什么,何時,如何從一個第三方的“點擊”)源(從一個非常大的用戶的實際網絡活動)。
我把那些搜索桌面(自動,當然),發(fā)現超過半數(53%)有功能的片段。正如我們看到的其他數據集,谷歌顯然是認真的直接回答。
一組流行的問題主要由“什么?”“怎么了?”短語:
鑒于流行的“如何?”問題,我打破了他們在這個圖表。紫色條顯示這些搜索中有多少是由片斷組成的。”如何?”問題很可能會顯示一個有特色的片段,其他類型的問題顯示他們不到一半的時間。
在包含了片段的完整數據集中大約5300個搜索中,這些片段分解為四種類型,如下:
文本片段-段落為基礎的答案,如在這篇文章的頂部-占約三分之二的所有特征片段在我們原來的數據集。列表片段占不到三分之一-這些是子彈列表,像這樣的“如何畫恐龍?”:
步驟1 -畫一個小橢圓。第5步- Dinosaur!就這么簡單。
表片段在我們的起始數據集中占不到2%的特征片段。這些片段包含少量的表格數據,像這樣搜索“我是哪一代?”:
如果你把你的錢肆意在你的鱷梨吐司的習慣而不是買房子,你可能是一個千年(對不起,內容營銷的笑話)。
最后,視頻片段是一個特殊類別的特色片段與一個大的視頻縮略圖和直接鏈接(占主導地位的YouTube)。這是一個“誰是最辣的memelord?”:
老實說,我不知道我可以添加什么評論的結果。由于目前沒有辦法讓視頻出現在谷歌的家,我們排除了視頻片段從其余的研究。
谷歌也在測試一些混合功能的片段。在某些情況下,例如,他們試圖從文本中提取一個特定的答案,如“1984時寫的答案”?(提示:答案不是1984):
本研究的目的,我們把這些雜種作為文本片段。鑒于頂部簡明的答案,這些混合動力非常適合語音結果。
從5.3k問題的片段,我選擇了1000,不包括視頻但故意包括不成比例的列表和表格類型(更好的看看如何翻譯成語音)。
為什么只有1000?因為,不像桌面搜索,有沒有簡單的方法來做到這一點。在幾天的過程中,我不得不在谷歌上手動運行所有這些語音搜索。有可能我暫時瘋了。有一次,我在谷歌的家里看到一只蜘蛛在盯著我看。擔心我的幻覺,我拍了一張照片,貼在推特:
我深信,蜘蛛,事實上,不只是我的臆想。我仍然不知道半小時時,蜘蛛唱我選擇漢密爾頓的配樂。
從片段到語音答案
那么,1000個搜索中有多少人得到了語音答案?簡短的回答是:71%。潛水更深,原來,這個百分比是強烈依賴于片段的類型:
在我們的1K數據的文本片斷產生的聲音回答87%的時間。列表片段降到了不到一半,而表段只產生三分之一的時間。這是有意義的-長列表和大多數表是很難轉化為語音。
在表格中,一些結果來自不同的站點或不同的格式。換句話說,搜索生成了一個有特色的片段和一個語音應答,但語音應答的類型不同(例如文本),并歸因于不同的源代碼。只有20%的表格式的功能片段產生來自同一源的語音答案。
從搜索營銷的角度來看,文本片段將產生一個語音答案近9次的10倍。優(yōu)化文本/段落的片段是一個很好的起點,在語音搜索排名,一般應該是一個雙贏的跨設備。
特殊:知識圖
那些沒有生成語音答案的功能片段呢?原來游戲中有很多例外。一個例外是直接來自谷歌家庭的知識圖表的答案,沒有任何歸屬。例如,“核選擇是什么?”在桌面上生成此功能片段(至少對我來說):
在谷歌的家,雖然,我得到一個不具名的回答似乎來自知識圖:
目前還不清楚為什么谷歌選擇了另一個在這個特殊情況下的聲音。在1000個關鍵字集,有大約30關鍵詞發(fā)生類似的事情。
特別:設備幫助
谷歌的家庭似乎把一些搜索作為設備特定的幫助。例如,“如何改變你的名字?”返回關于合法更改個人姓名的桌面結果。在谷歌的家,我得到以下:
從我們的列表中觸發(fā)設備幫助的其他搜索包括:
如何聯系谷歌?
如何在網上發(fā)傳真?
你在搞什么名堂?
特別:復活節(jié)彩蛋
谷歌家有一些復活節(jié)彩蛋,似乎獨特的語音搜索。我個人最喜歡的一個問題是“生活中是什么?”-生成以下:
這是我們1000個短語數據集中其他復活節(jié)彩蛋的列表:
字母表里有多少個字母?
你的強項是什么?
先來了什么,雞還是蛋?
我是哪代人?
什么是人生的意義?
做為一個小酒吧你會什么?
嬰兒來自哪里?
在世界上哪里是Carmen Sandiego?
我的iPhone在哪里?
瓦爾多在哪兒?
誰是你爸爸?
復活節(jié)彩蛋比設備幫助有點不可預測。一般來說,雖然都是罕見的,不應該勸阻你試圖排名的特色片段和語音答案。
特殊:一般混淆
在一個handful(簡單的用例,谷歌不明白問題或不能精確答案的問題。例如,我可以不去了解谷歌的問題“什么是地獄的意思嗎?”答案在有back(也許這是我的midwestern口音嗎?)是:
在第二次的思想,也許這不是inaccurate說。
一個有趣的案例是當谷歌決定答案A是卷曲的兩個不同的問題。在桌面上,如果你搜索“如何成為一個吸血鬼呢?”你會看到下面的代碼片段的功能:
在谷歌(Google)的家中,我要求我的意思:clarify
在這些案件的嫌疑人,都會在時間的改進,為語音識別兩個谷歌繼續(xù)前進,以surfacing變得更好的答案。
結果:特殊的配方
早在今年4月,谷歌的一個新的launched配方功能在谷歌搜索和家庭。許多“如何?”現在兩個問題相關的烹飪(Generate之類的東西,這個問題是“如何在你的兩個乳房的烤雞嗎?”):
你可以選擇找到一個配方在谷歌搜索和發(fā)送信息到你的家庭或谷歌,谷歌可以簡單的把一個配方的你。它的方式,它將指導你通過一步步指令的城市。
特殊:衛(wèi)生條件
一個婊子打或健康問題,從一般的問題生兩類疾病,下面的結果。“這是一個問題“為什么我們sneeze嗎?”:
這有沒有明確的連接兩個桌面搜索結果,這我不清楚,如果真的對未來的一個信號,擴展的功能性。它似乎是現在銀行有限公司使用。
特殊:wikihow
handful of a“如何?”不尋常的問題引發(fā)的反應。例如,如果在家庭問谷歌“如何寫一個出版社釋?”在回去:
如果說“是的,”我wikihow直接由兩個助理,辨別一個不同的聲音。《wikihow答案都比多語言文本型snippets功能。
我們應該如何適應?
語音搜索和語音電器(包括Google和Google的家庭助理)現在放的是很快的,它很難知道在哪里,任何本會總是在下一年。從一個搜索營銷standpoint,我認為它有道理滴一切投資兩個兩個的聲音,但我認為我們reached A點在大前鋒動量冰謹慎一些。
第一,在簡單的“高recommend大學如何感知你的行業(yè)和你的主要關鍵詞/問題”appear”在谷歌(谷歌助理或家庭在你的移動設備)??辞闆r,以上配方為99%以上的人閱讀這條,這是一個新奇的。如果你的空間的配方,雖然,它的游戲的變化,它的符號可能會享受一部來。
第二,我覺得snippets功能強,是一個雙贏的現在。幾乎90%的只讀文本功能snippets我們tracked yielded A的聲音回答。這是snippets也突出searches在線桌面和移動。snippets是一個偉大的功能為出發(fā)點的理解的聲音和你的foothold生態(tài)系統的建立。
文章標題:語音搜索的經驗教訓
標題路徑:http://www.rwnh.cn/news/20768.html
成都網站建設公司_創(chuàng)新互聯,為您提供品牌網站設計、靜態(tài)網站、網站建設、網站排名、企業(yè)網站制作、小程序開發(fā)
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯
猜你還喜歡下面的內容