原理:
創(chuàng)新互聯服務項目包括江南網站建設、江南網站制作、江南網頁制作以及江南網絡營銷策劃等。多年來,我們專注于互聯網行業(yè),利用自身積累的技術優(yōu)勢、行業(yè)經驗、深度合作伙伴關系等,向廣大中小型企業(yè)、政府機構等提供互聯網行業(yè)的解決方案,江南網站推廣取得了明顯的社會效益與經濟效益。目前,我們服務的客戶以成都為中心已經輻射到江南省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!
主流的大詞匯量語音識別系統(tǒng)多采用統(tǒng)計模式識別技術。典型的基于統(tǒng)計模式識別方法的 語音識別系統(tǒng)由以下幾個基本模塊所構成:
信號處理及特征提取模塊。該模塊的主要任務是從輸入信號中提取特征,供聲學模型處理。同時,它一般也包括了一些信號處理技術,以盡可能降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。
統(tǒng)計聲學模型。典型系統(tǒng)多采用基于一階隱馬爾科夫模型進行建模。
發(fā)音詞典。發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實際提供了聲學模型建模單元與語言模型建模單元間的映射。
語言模型。語言模型對系統(tǒng)所針對的語言進行建模。理論上,包括正則語言,上下文無關文法在內的各種語言模型都可以作為語言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計的N元文法及其變體。
解碼器。解碼器是語音識別系統(tǒng)的核心之一,其任務是對輸入的信號,根據聲學、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。
以上是語音識別的各個組成部分,而離線的語音識別,應該也是基于以上的原理,而且在手機內部內置了語音的字典,從而實現無線的識別
如:
1、瀏覽器提供的功能,比如chrome,如果沒有提供的話就不能用。
2、具體實現的細節(jié)主要是chrome的離線語音識別引擎。
3、調用系統(tǒng)api,瀏覽器是個app,可以訪問所有底層的api,只要系統(tǒng)提供就可以實現。
相關代碼如下:
!DOCTYPE HTML html head title簡單通過html5實現語音識別/title script if (document.createElement(“input”).webkitSpeech === undefined) { alert(“Speech input is not supported in your browser.”); } /script /head body
input type=”text” name=”value_2″ x-webkit-speech/
/body /html
是可以的,可以去H5edu看看,其HTML5培訓課程融合了HTML5開發(fā)基礎課程、CSS3基礎課程和移動前端交互JavaScript+JQuery+Ajex等課程,從入門到精通,讓開發(fā)者全面學習HTML5
找到php的音頻轉換工具,基于html5開發(fā)的android和ios的app應用上實現語音聊天功能也就理論上打通了。
1. 用phonegap封裝成android應用,phonegap官網上有詳細介紹
2.實現js和android原生語言java的通信(google有介紹)
3.調用原生語言實現錄音功能(mediaRecorder類),錄音格式為 amr格式(android本身支持的語言)
4.回調js方法,把amr文件地址傳給phonegap,利用phonegap讀取錄音文件并上傳到服務器端
5.服務器端利用ffmpeg2theora 將amr轉為html5支持的音頻格式ogg
6.接下來讀取文件,利用html5的audio 播放ogg文件。
!DOCTYPE html
html xmlns=""
head
title/title
script type="text/javascript"
var wsServer = 'ws://localhost:9999/webSocket.ashx'; //基于.NET4.5服務器地址
//var wsServer = 'ws://localhost:1818'; //基于.NET服務器地址
var websocket = new WebSocket(wsServer); //創(chuàng)建WebSocket對象
//websocket.send("hello");//向服務器發(fā)送消息
//alert(websocket.readyState);//查看websocket當前狀態(tài)
websocket.onopen = function (evt) {
//已經建立連接
alert("已經建立連接");
};
websocket.onclose = function (evt) {
//已經關閉連接
alert("已經關閉連接");
};
websocket.onmessage = function (evt) {
//收到服務器消息,使用evt.data提取
evt.stopPropagation()
evt.preventDefault()
//alert(evt.data);
writeToScreen(evt.data);
//websocket.close();
};
websocket.onerror = function (evt) {
//產生異常
//alert(evt.message);
writeToScreen(evt.message);
};
function sendMsg() {
if (websocket.readyState == websocket.OPEN) {
msg = document.getElementById("msg").value;
websocket.send(msg);
writeToScreen("發(fā)送成功!");
} else {
writeToScreen("連接失敗!");
}
}
function writeToScreen(message) {
var pre = document.createElement("p");
pre.style.wordWrap = "break-word";
pre.innerHTML += message;
output.appendChild(pre);
}
/script
/head
body
div
input type="text" id="msg" value="beyond is number one!" /
button onclick="sendMsg()"send/button
/div
div id="output"/div
/body
/html
H5edu實訓html5開發(fā)解答
如果想指定語言類別,還可以增加lang屬性,如:inputx-webkit-speech lang="zh-CN"/。以及表示語法的(據說bUIltin:search可以過濾助詞):input x-webkit-speech x-webkit-grammar="bUIltin:search" /
還有一個onwebkitspeechchange的方法,發(fā)生在語言識別成功,且文字輸入到文本框后觸發(fā)。
網頁名稱:html5聊天語音,語音聊天實現
URL標題:http://www.rwnh.cn/article16/dscdcdg.html
成都網站建設公司_創(chuàng)新互聯,為您提供品牌網站建設、標簽優(yōu)化、電子商務、網站收錄、營銷型網站建設、網站設計公司
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯