中文聊天機器人面市 瞬遭中國政府鉗制

2023.08.31 15:45 ET
中文聊天機器人面市 瞬遭中國政府鉗制 中文聊天機器人--百度"文心一言"標誌
路透社圖片

8月31日,"文心一言"、"商量"等四款聊天機器人正式向中國公衆開放。但很快傳來消息,在向這些機器人提出政治敏感話題時,聊天就會被迫中止。中國政府的鉗制手段到底是如何伸進聊天機器人的運行中的?這種限制對人工智能技術的發展又會帶來怎樣的影響?

 

 

這次向公衆開放的聊天機器人或生成式人工智能產品,包括商湯科技“商量”、百度“文心一言”、智譜AI“智譜清言”和百川智能科技的“百川大模型”等,他們均是​​依據《生成式人工智能服務管理暫行辦法》向中國政府備案後,向大衆開放的。

據廣州日報客戶端等媒體報道,北京的抖音(雲雀大模型)、智譜AI(GLM大模型)、中科院(紫東太初大模型),上海的MiniMax(ABAB大模型)和上海人工智能實驗室(書生通用大模型)等多家企業和機構的人工智能產品,也位列第一批獲批名單。

被打碼的"天安門大屠殺"

但很快外界就披露,在使用“文心一言”等人工智能平臺時時,對敏感政治話題有不少限制。

一位計算機專業在讀大學生上週四(8月24日)在虛擬機和代理上試用了中國瓴嶽科技的Smart Chat智能客服平臺,並給本臺發來了他試用的一段視頻。視頻中,當他用英文提問,1989年6月4日發生了什麼時,平臺用三段英文回答了這個問題,大意是:1989年6月4日在天安門廣場發生了大屠殺;中國政府用部隊和武器鎮壓了學生們的示威;這一事件對中國政局和人權產生了深刻的影響。

這幾段話似乎與外界對六四事件的理解和記憶並沒有什麼差別,但在幾段文字完成顯示後,其中的關鍵詞全部被以星號取代,包括“天安門大屠殺”、“人權”和“言論自由”等。

這位學生匿名向本臺分析說,Smart Chat智能客服平臺實際是套用了美國公司OpenAI的人工智能產品chatGPT,但附加了一些審查功能。他還強調,現在雖然文心一言等平臺開放使用了,但他不敢實名嘗試去問政治敏感問題,“怕被勾勒用戶畫像。”

無獨有偶,德國之聲在檢測“文心一言”時也發現,在與其對話時,如果輸入“臺灣獨立”、“維吾爾族”、“中國青年失業率”等敏感話題時,系統就會終止對話。

由於中國政府一直以來對言論的嚴格管控,對於聊天機器人的這種表現,外界似乎並不感到驚訝。身在華盛頓的IT專家弗蘭克(Frank)向本臺分析說,這種人工智能系統要阻擋政治話題的討論並不難做到,“只要在它的AI系統裏放一個過濾器,在最後結果出來之前放一個過濾器,那些相對敏感的語言馬上就會被控制,並不是說它願意做什麼就做什麼。”

2023年8月31日,手提電腦屏幕上顯示的中文聊天機器人--百度"文心一言"。(法新社)
2023年8月31日,手提電腦屏幕上顯示的中文聊天機器人--百度"文心一言"。(法新社)

就像"嚴歌苓"一樣

但人工智能本身是在西方世界自由的科技交流環境下發展起來的,中國嚴格的審查制度與人工智能發展似乎從一開始就顯得格格不入。

外界普遍認爲,目前的中文聊天機器人使用的底層技術,實際都來源於chatGPT的開源代碼。一位身在美國馬里蘭州的IT專家匿名向本臺分析說,代碼開源這本身體現了歐美技術人員的理想主義精神,但言論審查制度卻與之相反;而這種做法本身對於人工智能發展有多方面的負面影響。

他認爲,在軟件開發者的環節,言論審查制度就會造成障礙,“開發的時候,你會怕犯錯誤,就會加上很多安全功能(safety function),這個字不能用,那個字不能用,這就會把程序搞得非常麻煩。”他說,這就像前不久華裔作家嚴歌苓接受採訪時說的一樣,她在國內進行創作時,已經有了很多自我審查。

他強調,更重要的是,這種前置的自我審查本身就與人工智能的屬性是相矛盾的,“聊天機器人這種東西他本來的思路就跟人不一樣,這就是他的魔力所在;如果所有的答案都是可以預測的,那這就跟搜索功能沒什麼差別了。他本身的功能就在於把很多你意識不到的東西綜合起來給你一個很好的回答。”

弗蘭克(Frank)則告訴本臺,中國政府對言論和信息的控制會影響到中文方式呈現的數據,“它(人工智能)都是靠統計信息,比如你跟它諮詢的問題,它是隻能統計中文的信息,中文的信息又主要是以大陸的信息爲主,但大陸的數據受到限制。所以很多問題它答不出來,或者答出來是錯誤的。”

弗蘭克說,這種信息質量影響到的不僅是中文的聊天機器人,還包括chatGPT的中文信息。他舉例說,1980年代中國非常有名的四通科技公司,在chatGPT裏就找不到可靠的信息。

另一方面,這麼多的中文聊天機器人同時面市還牽涉到新的問題。前述那位匿名的IT專家分析說,其中主要是算力問題,“現在這些平臺都要求算力無窮,這對中央處理單元(CPU)的要求是很高的,但現在中國在這方面已經受到出口限制了,我不知道中國的算力能不能跟得上,這些都是規模很大的計算。”

他還強調,現在的chatGPT已經到了4.0版,這一代的代碼已經不再開源,中國企業在這方面能否跟得上技術的發展也是一個問題。

 

記者:王允    責編:梒青    網編:洪偉

添加評論

您可以通過填寫以下表單發表評論,使用純文本格式。 評論將被審覈。