国产另类第一区,国产精品久久中文,在线中文字幕视频观看,伊人久久久大香线蕉综合直播

一道小學奧數題4個AI平臺答案不一,專家這樣回應

據上游新聞微信公眾號:“給娃兒輔導奧數題,問了多個AI平臺,每個答案都不一樣。”

近日,重慶家長劉先生向上游新聞記者反映:同一道奧數題,百度、阿里云、今日頭條等國內4個主流AI大模型平臺,竟然給出了不同的答案。

3月11日,上游新聞記者從百度客服及人工智能專家處了解到,人工智能大模型平臺并不是題庫,數據模型一直在學習完善中,尤其是在數學和邏輯方面。

同一道奧數題,劉先生得到結果為30分鐘、7分鐘兩種不同答案。/受訪者供圖

劉先生告訴上游新聞記者,自己的孩子上小學四年級,最近他在輔導孩子做奧數題,但自己并非理工科出身,感覺有些困難。因為他從事影視制作方面的工作,經常使用人工智能工具輔助,就想到使用類似平臺來幫忙。

劉先生將一道題輸入經常使用的百度的文心一言、阿里云的通義千問、今日頭條的豆包等4個主流人工智能大模型平臺進行測試。具體題目為:一天,萱萱到離自己家4000米的表哥家去玩。早晨7:20,萱萱從家出發向表哥家走去,每分鐘行60米,同時表哥騎車從家出發來接她。表哥到萱萱家后才發現萱萱已經走了,又立即返回去追,表哥騎車每分鐘行260米。當表哥追上萱萱后,帶著她一起回表哥家,這時騎車速度為每分鐘175米。請問:當他們到達表哥家時,還差幾分鐘就到8點?

“當時兩個(AI平臺)列出了推理過程,均給出了‘7分鐘’的答案,應該是對的。我覺得算得有點復雜,就又讓AI用適合小學五年級的算法再算一次,結果答案自此之后就不一致了。”在劉先生提供的截圖中,上游新聞記者看到,有的平臺會給出“30分鐘”的答案。

上游新聞記者測試時,要求AI重新計算,有的AI甚至給出了“還差-23分鐘就到8點”的離譜答案。劉先生感覺很困惑:“是不是AI自己不敢保證是正確的,多問幾遍它自己就把自己繞暈了,越回答越錯?”

記者得到了一個“-23分鐘”的答案。/截圖

11日,上游新聞記者致電文心一言會員服務熱線詢問此事,工作人員表示,“目前的系統回復不是每次都一模一樣的,它主要針對您的提問和您輸入問題的一個復雜性程度進行回復。如果是它輸出的結果是不滿意或者是有誤的,您可以及時點踩反饋,幫助文心一言進步。”

工作人員表示,反饋提交之后,后臺工作人員也會去不斷優化模型的一個能力,“因為AI生成的結果,是根據您輸入的一個需求和提示詞提供的,它是自動識別和理解您的一個意圖和需求,并提供相關的文本圖片,目前模型能力確實也在不斷地發展,需要時間?!?/p>

無獨有偶。在上海從事AI類自媒體的白先生(化名),也用孩子的數學題測試了國外的GPT4、Claude和Google Bard等AI平臺以及國內多個主流AI平臺,也發現了類似問題,甚至有的AI對題意都出現了理解錯誤。

一位國內人工智能方面的專家告訴上游新聞記者,目前主流的AI大模型平臺并不是數學題庫,“大數據模型一直在學習完善中,尤其是在數學和邏輯方面,所以很多產品對話框旁邊都有點贊點踩的圖標。通過這種方式反饋問題,模型才會學習完善。如果家長想要更精準的答案,更推薦給孩子使用學習機一類的AI產品。”

該專家表示,“即便是目前國際上一些數學、化學、物理等方面的專業性做題AI,也很難拿到奧賽滿分?!?/p>

據參考消息,今年1月,美國一個名為阿爾法幾何(AlphaGeometry)的AI系統,能做出國際數學奧林匹克(IMO)的30道幾何題中的25道,已經接近人類奧數金牌得主水平,該突破性成果甚至登上了著名的《自然》(Nature)雜志。

據報道,美國亞利桑那州立大學副教授沙卡里安,在2023年1月初用1000個數學問題對ChatGPT進行了測試,結果發現準確率只有60%,低于一般中學生的準確率。

牛津大學機器學習研究員西蒙·弗萊德爾,曾在一項研究中讓ChatGPT做了一系列數學任務,包括簡單的計算、數學證明題、搜索數學文獻和奧數題,結果也發現,ChatGPT在大多數任務上表現為“不及格”,在需要多層邏輯推導的題目上表現尤為糟糕。而最具迷惑性的是,哪怕ChatGPT做錯數學題,也會非常“迷之自信”地給出看起來權威的錯誤答案。

專家表示,AI的語言模型目標在于處理和理解人類的語言,更擅長生成類似人類的對話,而不是為了成為完美的數學計算器,“AI作為一種工具,只適用于那些最懂數學的人,而不是最不了解數學的人。在借鑒AI給出的答案之前,一定要加以驗證,不要過于依賴它?!?/p>

相關閱讀

霉霉AI不雅照被瘋傳,約束AI迫在眉睫

美國知名歌手泰勒·斯威夫特再度成為了AI深度偽造的受害者,近日,大量由人工智能生成的泰勒虛假色情、血腥照片在多個社交平臺瘋傳,瀏覽量已超過千萬,引發社交媒體震動,這也引發了美國白宮的注意

?共建AI PC新生態“ 子曰”大模型 為教育事業帶來AI普惠

12月7日,以“AI新生態智啟新元年”為主題的首屆AI PC創新論壇在北京舉辦,論壇圍繞大模型終端化、AI PC產業發展等議題進行了深度探討。

及時語 | AI“復活”親人,你愿意嗎

在數字化浪潮席卷全球的今天,AI技術的突飛猛進似乎為我們打開了一扇通往“永生”的大門。

“AI客服快把人逼瘋了!”智能客服答非所問 人工客服要排長隊

業內人士認為,有關部門應針對企業客服AI化現象,通過制定相關管理規范標準,加強對AI客服的監管,避免企業利用AI客服逃避責任和義務。

AI換“熟人”敲詐能有多逼真?教你如何識別和預防AI詐騙

近日,有媒體曝光了一起詐騙案件,被詐騙者遭遇AI換臉詐騙,10分鐘被“好友”騙走430萬元。近年來,AI換臉、換聲視頻在網絡上流行起來,AI合成的技術門檻逐漸降低。
評論一下
評論 0人參與,0條評論
還沒有評論,快來搶沙發吧!
最熱評論
最新評論
已有0人參與,點擊查看更多精彩評論

請輸入驗證碼

返回頂部
主站蜘蛛池模板: 莱芜市| 和田县| 和硕县| 咸宁市| 页游| 阳城县| 唐河县| 遵化市| 平泉县| 广饶县| 德阳市| 砚山县| 高陵县| 仙游县| 田林县| 浦北县| 新闻| 砚山县| 宁远县| 承德县| 古浪县| 来宾市| 吴桥县| 辰溪县| 娱乐| 高清| 封开县| 开阳县| 汾阳市| 神池县| 南漳县| 应用必备| 朝阳市| 鹰潭市| 徐闻县| 潜山县| 崇文区| 双桥区| 金川县| 六安市| 湘西|