智能語音拼寫軟件肯定需要一個大的詞彙庫。
那樣的詞彙庫,並不是單單指文字的詞彙庫,更重要的每一個字在各地的普通話中可能出現的地方口音。
比如普通話大部分中國人會說,但是真正說得標準的人並不佔優。特別沒有幾個人能真正將所有漢字都會讀,更不會要說是說得標準。另外有很多字是多音字,語音拼寫又必須兼顧效率和準確。
所以一個龐大的詞彙庫是肯定很需要的。而這個數據庫因爲涉及到音軌數據,數據量也比文字要大得多。
那最好是利用一個雲計算技術進行解決。將全國所有人針對各個詞組的口音和錯誤方式都收集起來。甚至是可以用方言進行創作。
所以這個智能語音拼寫軟件,唐浩澤真心不是很很急。其實也急不來。
不過該做的,也應當提前做起來。
他提議說:“我們可以邀請用戶錄製我們指定的文章音軌文件。參與的人,可以在網站上給予一定的獎勵。”
向子榮聽他這話,也明白他話裡所指。他皺眉說:“如果通過那樣收集數據模板。我們的工作量會很大。”
“反正我們也不急於求成。收集到足夠的數據後,在綜合分析並且建立模板。”
向子榮想了想,說:“好,我回去讓人選擇幾篇合適的文章先試一下。”
“閱讀的文章,可以選擇一些名篇。不需要他們用朗讀的方式。而是用說話的方式。流暢就好。”唐洪澤想一下,建議說。“比如說用魯迅先生的文章。還有一些古文,比如《愛蓮說》、《長歌行》等等中學課本上的文言文或者長詩。”
向子榮一聽,笑着說:“這個主意不錯。”
中學語文課本收錄的魯迅先生的文章和文言文,有不少是要背誦的。文言文就不用說了,那與現在的語言習慣有很大的不同,朗讀和背誦並不容易。而魯迅先生的文章讀起來都會覺得有些拗口,背誦起來肯定不好受。
所以在中學時代有一句名言:一怕周樹人,二怕文言文。
有那樣的文字的閱讀數據,應當可以建立不少的模板。
兩人又就這個問題談了一會,向子榮才離開了。
沒幾天,圈子網集團又製造出一個大新聞。
《是圈子網還是是瘋子網?》
以上是《計算機世界》刊登的一篇文章的標題。
該文的作者在文章中指出:“圈子網的將批評是做污衊或者誹謗的。將無意的過錯當做罪過。編者注意到在圈子網集團已經向法院起訴中的被告名單中,發現了幾個著名的博【2】客主。他們都是比較著名的公共知識分子。公共知識分子存在的意義就是向公衆傳播知識,對公共事務進行分析……”
然後又說:“編者還注意到,當圈子網某個子網站涉嫌傳播淫【2】穢視頻事件發生後,對圈子網做出了批評,但是在圈子網澄清之後,不少因此被告的人在不久之後就刪除了自己的言論。這不能說那些被告沒有過錯,但是知錯能改,善莫大焉。圈子網悍然將他們也訴諸法庭,未免太過不近人情……”
最後的結論還聽辛辣:“……我們注意到,僅僅三天時間,圈子網集團在全國範圍內就該時間針對個人提起的誹謗訴訟案高達六百多起。具圈子網集團的公告,似乎還會有更多。這種做法看似保護了圈子網集團的權益。但是以言入罪,與古代的文字獄有何差別?圈子網集團這種瘋狂的行徑,無疑會極大損害網絡發展。”
唐浩澤看過這篇文章後,嗤笑一聲。
文字獄?這是將圈子網集團當做野豬皮人了?
他不屑於迴應。不過圈子網集團的公關部不是吃素的,當即發表了一份聲明。
“我們注意到某計算機權威報刊報刊登的某位著名水軍頭目的文章。改文章聲稱圈子網集團的維權行動是瘋子行爲,將會危害中國網絡的自由發展。對此我們不僅不敢苟同,更覺得極其荒誕。圈子網集團在第一時間要求所有人停止對我司的誹謗和污衊。但是在事情得到澄清後,依然有不少人拿了錢而繼續在網絡上,繼續有針對性、有目的性地散播謠言,繼續污衊誹謗圈子網。而現所有被起訴的人,我們都有證據顯示他們是拿錢辦事的。
“至於說批評,如果是符合客觀事實的,我們會虛心接受批評,更會認真改正。但是某些所謂公知分子的批評,我們是敬謝不敏的。公知分子的可敬之處勿用贅言,但絕對不包括拿錢說話。至於證據,我們有。但只會交給法庭。
“我司可以毫不諱言,這篇文章的作者也在我們的起訴名單之內。至於說我們的維權行爲不僅不會給網絡帶來阻礙,反而會對肅清網絡起到積極作用。網絡不應當成爲被人用來傳播謠言以獲取利益的平臺。網絡也不應當因爲其虛擬性就可以成爲某些人沒有原則、沒有根絕、沒有底線的語言暴力平臺。
“我司誓將用法律武器維護合法權益,不會因爲任何外來干擾而又改變。”
圈子網集團在輿論上針鋒相對,在當日更再次公佈了一批起訴被告名單,名單內果然有那位《是圈子網還是瘋子網?》的作者。名單內總被告人數高達一千六百人多人。
圈子網集團的我行我素引起輿論的一片譁然。指責圈子網集團是得理不饒人、不近人情。
唐浩澤對此並不在意。圈子網集團是受害者,別人說什麼。他都只想給那些人一句話:干卿底事!
外面的紛擾絲毫沒有干擾到他的生活和工作。這天盧夢因爲工作離開公司,下班也就直接回家了。他下班從公司出來。車子纔開出地下停車場出口。
張文說:“老闆,前面是南警官。”
唐浩澤從車窗看了一眼,看到南軒鬆在前面的伸手示意車子停下。他就讓張文先停下。
南軒鬆小跑過來。唐浩澤按下車窗笑着說:“南警官,這不是要我去協助調查吧?”
“當然不是,就是有點事想和唐先生談一談。”
唐浩澤說:“上車!”
南軒鬆從車後轉過另外一邊上了車。唐洪澤讓張文繼續開車,這纔對南軒鬆說:“南警官想和談什麼?”
“唐先生,圈子網集團這幾天的行動讓我們的工作相當被動。當然,我不是說你們的維權行動有錯,但起訴的人太多。影響太大了!”
唐浩澤一臉不解,問:“南警官的意思是我們被人欺負了就要忍聲吞氣?”
“當然不是要忍聲吞氣。但我知道圈子網起訴那些人並不是爲了要求賠償。只是想要的給那些人發出一個警告,這個目的現在也已經達到了。但這個警告波及的人太多。那不僅增加了圈子網集團的工作量。更增加了圈子網的經營成本。”
唐浩澤笑着搖頭說:“南警官太看得起圈子網了。我們集團只是小本經營,大雞也吃小米。多一分錢收入就是多一分。這次起訴我們可以打算從那些人身上狠狠刮一層。”
南軒鬆自然不會相信他的鬼話,但也不會傻得去反駁:“網絡的亂象,我們網監中心也一直在監控並且壓力打擊。不過我想不管是我們職能部門,還是包括圈子網集團在內的互聯網企業,都希望互聯網能有序、高速發展。圈子網集團的這次行爲,自然是正當的維權行動。但也有可能會造成比較惡劣的影響。”
他頓了一下,說:“極有可能會讓有關部門出臺更嚴格的法規約束網民行爲。那雖然是有必要的。但現在正是互聯網的高速發展期,太過嚴格的法規,會遲緩互聯網行業的發展。大環境發生變化,圈子網也會受到影響。”
唐浩澤聽完這話,肅容說:“南警官。你不要嚇我。我是復旦出來的,可不是廈大畢業的,不經嚇!圈子網一個小小的維權行動就能讓上面出臺那樣的法規?”
“圈子網這幾天在滬市幾個地方法庭陸續提起了兩百多起訴訟案。這已經極大引起我市領導的關心。甚至已經引起了中央網監部門的關切。”
在和南軒鬆的交談中,唐浩澤想了許多。他相信南軒鬆特地找他,說的那些話不是無的放矢。圈子網集團高調起訴那些人無可指摘。但也將互聯網的一些陰暗面暴露出來。
任何一個世界都有光和暗的糾結。但圈子網集團的做法確實讓有些部門坐蠟。
既然是這樣,他就給他們一個面子也未嘗不可。
但該告的人肯定是要告的,但絕對不能向之前那麼高調了。
唐浩澤想了一會說:“圈子網集團說過的話,不能自打嘴巴!”
南軒鬆心裡鬆了一口氣。他也不敢得寸進尺,說:“只要低調一些就好。另外最好和那些侵害圈子網集團權益的人或者單位先協商解決。在輿論上,也請圈子網保持克制。”
唐浩澤點頭說:“感謝南警官的提醒!”說完又問南軒鬆要去哪裡。
南軒鬆說在路上放下他就好,但唐浩澤還是將他送到目的地。