文本撰寫,我們講說機器在文本撰寫方面極致會達到什么地步?今天在中國我不知道大家炒不炒股票和買不買基金,中國金融市場95%的滬深兩市其他主要金融摘要信息都是由機器生產(chǎn),持續(xù)到目前為止已經(jīng)8個月了,這是非常嚴(yán)肅的金融信息的生產(chǎn)。它的記錄是非常高的可靠性和成熟度。
我們講講今天跟教育主題可能是有一些相關(guān)的,我們剛才講了文本生成,講了聲音。把所有東西都結(jié)合在一起可以做什么?我給大家看一下我們嘗試的一個小小的東西。
大家剛才聽到的這段音頻是百分之百由機器生產(chǎn),現(xiàn)在我們?nèi)斯ぶ悄芗夹g(shù)可以做到你只要把這段文字給機器,機器通過自然語言理解來判別這段故事有幾個角色,為每一個角色分配聲音處理不同的聲音。同時根據(jù)這個角色講的內(nèi)容來決定她朗讀的語氣。最后我們?yōu)槭裁刺岢鲎鲈~曲創(chuàng)作呢,整個這段背景音樂是機器自己生成。這里沒有任何版權(quán)問題,全是機器自己生產(chǎn)。這里角度來講,這里最大的變化在于說這個過程速度非???,我們今天講一個200小時格林童話人生產(chǎn)要讀多長時間,機器來做17分鐘就能做完。我們從去年的11月份開始到今年3月,每天找一些公版的有聲讀物放服務(wù)器里面,然后人就回家了,第二天早上回來機器生產(chǎn)完了,我們到現(xiàn)在已經(jīng)生產(chǎn)了1680個小時的公版的有聲讀物。
從3歲聽到6歲,每天不停的聽不重樣也聽不完。同時我們把這項技術(shù)給當(dāng)當(dāng)包括其他的出版社用來生產(chǎn)有聲讀物,整個有聲讀物的生產(chǎn)的效率和速度能得到極大的提升。喜馬拉雅搜索小冰講故事,我們把所有生產(chǎn)的東西都放在上面讓大家去驗證。這個技術(shù)的改變可能是改變我們對所有內(nèi)容的生產(chǎn)的方式、生產(chǎn)的效率以及消費它的方式。生產(chǎn)效率和生產(chǎn)方式可以理解,今天可以讓機器生產(chǎn),機器可以低于人的成本。那什么是消費方式呢?這個生產(chǎn)技術(shù)流程我稍微說一下。在所有過程里面,你知道我們可以讓機器不用線性生產(chǎn),但是生產(chǎn)完了之后如果你要去檢查的話,你也是要花一樣的時間。一個20分鐘故事不快進也要聽20分鐘。怎么解決這個問題?我們研發(fā)另外一套系統(tǒng)機器自我去審聽多音字的錯誤。包括各種問題,我們做了免檢,可以把準(zhǔn)確率免檢提高到97%,就意味著今天機器自動生產(chǎn)有聲讀物的質(zhì)量能夠超越我們今天在所有有聲讀物市場上,比如今天喜馬拉雅上絕大多數(shù)的人類有聲讀物生產(chǎn)者讀的東西,在準(zhǔn)確率是要高于他們。當(dāng)然這種技術(shù)永遠不會替代今天人類社會最頂尖的有聲讀物生產(chǎn)者,比如今天在中國比如凱叔講故事,凱叔生產(chǎn)的東西由導(dǎo)演反復(fù)策劃包括后期修,我們比不了。但是大規(guī)模生產(chǎn)領(lǐng)域,技術(shù)其實現(xiàn)在已經(jīng)?揮形侍???
我們剛才講改變了消費方式是什么?我們今年7月份推出了小冰童話工廠,你登陸H5之后,告訴機器你希望這個主角是誰?比如你們家孩子叫樂樂還是大熊,機器自動生產(chǎn)以他為主角的故事并把它朗讀出來,這是第一版。我們剛剛推出第二版,不僅是他的主人公機器可以帶進去,可以幫你帶配角。我講一個我們家多多和他養(yǎng)的一條狗大黃和玩具熊小花的故事,機器給你做了他們?nèi)齻€的故事,這個也是一個無限制的生產(chǎn)過程。我們現(xiàn)在準(zhǔn)備推出下一代,就是小朋友在聽故事的時候,同時可以打斷機器。比如講到了,你們家樂樂和大熊的故事,講著講著,剛才大熊說了什??,机器停了再重竸?chuàng)笮芩盜聳裁礎(chǔ)?