在信息急劇增長的時代,科研工作者們往往面臨著海量的文獻資料和繁瑣的數(shù)據(jù)處理任務。為了幫助大家更高效地進行水科學領域的研究,北京大學環(huán)境科學與工程學院基于百度文心大模型推出了全新的水科學研究助手——WaterScholar!它基于強大的文獻數(shù)據(jù)庫和檢索增強技術 RAG,讓您輕松查詢文獻、梳理引言、總結內(nèi)容、回答問題,現(xiàn)已在星河社區(qū)上線,歡迎相關領域?qū)I(yè)人士與高校師生體驗!
01
響應科研需求,創(chuàng)新科技助力
水科學作為一門綜合性學科,涉及水文水循環(huán)、給排水、水環(huán)境化學、水污染控制、水生態(tài)修復與保護、水系統(tǒng)可持續(xù)管理、氣候變化等研究領域,與泥沙、礦物質(zhì)、鹽類、有機質(zhì)、溶解性氣體、重金屬、化學污染物、蛋白質(zhì)、藻類、浮游動物、魚類、鳥類、水生植被等物質(zhì)或生命體關系密切,其研究內(nèi)容廣泛而復雜,發(fā)表的相關文獻累積已超過1500萬篇,并且每年正在以超百萬量級的速度增長。
水科學研究領域?qū)φ泶罅康目蒲形墨I的需求愈發(fā)強烈,然而,傳統(tǒng)的文獻檢索和信息整理方式往往耗時耗力,難以滿足深入挖掘潛在信息、梳理前沿進展、探索問題新方案等日益增長的需求。水科學研究范式亟需拓展,尤其是文獻梳理、知識學習以及科研輔助。
因此,北京大學環(huán)境科學與工程學院劉永教授研究組攜手百度 AI,推出水科學研究助手WaterScholar,旨在通過智能化的方式,簡化科研流程,提高研究效率,讓科研工作者們能夠更專注于研究本身,發(fā)掘更多有價值的科研成果。更多信息請前往官網(wǎng)介紹(
https://www.waterscholar.com)。
▎體驗鏈接(請登錄后使用,多工具智能編排邀測中,分鐘級通過白名單審核)
https://aistudio.baidu.com/community/app/70479/webUI
02
輕松上手,知識速成
WaterScholar 基于飛槳星河社區(qū)(AI Studio)平臺開發(fā),底層大模型為文心大模型。目前階段實現(xiàn)的主要功能為查詢水相關領域文獻、圍繞關鍵詞撰寫引言、總結概括簡化內(nèi)容、根據(jù)文獻回答問題,希望能為對水科學研究領域感興趣的用戶提供幫助,包括研究人員、學生、工程師等。
■ 功能1:查詢水相關領域文獻
功能描述: 根據(jù)提供的關鍵詞信息在數(shù)據(jù)庫中檢索相關的文獻信息,并生成相應的文本文件;
返回結果: 返回查詢到的文獻內(nèi)容、下載鏈接和提示信息。
■ 功能2:圍繞關鍵詞撰寫引言
功能描述: 根據(jù)傳入的關鍵詞撰寫水科學領域的英文引言,引言長度在800-1200詞之間,內(nèi)容包括研究問題的重要性、相關研究進展、存在的問題或不足、以及將要開展的研究內(nèi)容;
返回結果: 返回撰寫好的英文引言內(nèi)容和提示信息。
■ 功能3:總結概括簡化內(nèi)容
功能描述: 根據(jù)傳入的文獻摘要內(nèi)容進行總結,并去除無關信息,返回簡要介紹;
返回結果: 返回總結后的文獻摘要內(nèi)容和提示信息。
■ 功能4:根據(jù)文獻回答問題
功能描述: 根據(jù)文檔內(nèi)容回答提供的問題;
返回結果: 返回根據(jù)文檔內(nèi)容回答問題的結果和提示信息。
03
技術方案:文獻數(shù)據(jù)庫+RAG
智能處理更高效
WaterScholar 的強大功能得益于其背后的兩大核心:文獻數(shù)據(jù)庫和 RAG 技術。首先,數(shù)據(jù)庫基于在線文獻數(shù)據(jù)集(英文),獲取到水科學領域的關鍵文獻清單。其中文獻來自于水科學領域數(shù)千種學術期刊和會議,數(shù)量超過300萬篇,信息包含題目、摘要、作者、時間、研究對象、研究問題與方法等。通過語義相似性匹配等智能搜索算法從文獻摘要信息中快速準確地找到與用戶關鍵詞相關的文獻列表,處理為可下載的文件鏈接。鏈接分為兩部分:文獻清單與文獻摘要,提供豐富的研究素材,用戶可下載文件并在本地閱讀與使用。其次,RAG(Retrieval-Augmented Generation)是一種將檢索技術與語言生成技術相結合的創(chuàng)新方法,旨在提高搜索結果的準確性和多樣性,實現(xiàn)對文獻內(nèi)容的深度理解和智能處理。它能夠自動提取文獻中的關鍵信息,生成高質(zhì)量的引言和總結,并根據(jù)用戶的需求提供有針對性的回答,提高了工作效率,降低人為因素導致的誤差和遺漏。
WaterScholar 充分發(fā)揮了北大環(huán)境學院在專業(yè)領域的資源優(yōu)勢和百度文心大模型的技術優(yōu)勢。首先,文心大模型的解析調(diào)度模塊可根據(jù)用戶輸入確定是否使用工具 API 及解析參數(shù)取值,并發(fā)出啟用服務命令;WaterScholar 收到請求后提取 API 需要的參數(shù),完成文獻查詢、結果處理、文件生成等功能,并將其摘要緩存在服務器端;工具服務完成處理后,以 json 格式返回由摘要緩存、用戶需求、prompt 模板形成的數(shù)據(jù);文心大模型匯總結果并按要求智能生成答案。
04
團隊介紹
劉永
北京大學教授、環(huán)境科學與工程學院院長
國家環(huán)境保護河流全物質(zhì)通量重點實驗室副主任
主要研究方向為湖泊-流域過程與調(diào)控,主持國家水專項、973計劃青年項目等,發(fā)表 SCI 論文150余篇,出版第1作者專著5部;獲中國青年科技獎、中國生態(tài)環(huán)境十大科技進展等,兼任教育部科技委委員、Limnology and Oceanography 副主編等。
蔣青松
北京大學環(huán)境科學與工程學院助理研究員
主要研究方向為流域科學與機器學習算法,發(fā)表論文17篇,以第一作者申請授權軟件著作權6項,出版專著2部;獲國家青年自然科學基金項目資助。
05
常見問題解答,讓您更放心使用
為了讓大家更好地使用 WaterScholar,整理一些常見的問題和解答:
■ Q1: WaterScholar 與相似產(chǎn)品有何不同?
本項目開展的 WaterScholar 將更加聚焦于水體研究領域,雖然涉及眾多自然學科,但主體圍繞水體進行知識問答或引言梳理,提供更加專業(yè)性的事實依據(jù)和知識生成服務。
■ Q2: 文獻如何實現(xiàn)匹配與排序?
目前 WaterScholar 通過后端程序?qū)崿F(xiàn)云端數(shù)據(jù)庫的訪問,根據(jù)用戶查詢文獻時輸入的關鍵詞與數(shù)據(jù)庫中的文獻摘要計算文本相似性,按照相似性得分高低排序,并返回前20篇文獻。
■ Q3: 文獻來源是否真實可靠?
文獻全部來自于 SCI 數(shù)據(jù)庫,保留了含有摘要的300余百萬篇文獻,信息來源真實可靠;包含的信息還包括年份、題目、作者、DOI 鏈接、期刊、關鍵詞、引用數(shù)、研究領域等。
■ Q4: WaterScholar是否支持多種語言?
目前,WaterScholar 主要支持中文和英文,其中查詢文獻時建議使用英文關鍵詞進行檢索,使專業(yè)術語的語義匹配更準確;后續(xù)逐步增加對其他語言的支持。
■ Q5: 我是否可以修改生成的提示詞?
生寫一段質(zhì)量較好的答案需要復雜的提示詞,包括對文字長短、內(nèi)容要點、格式等方面的約束。目前已經(jīng)在工具中準備了必要的提示詞,但用戶可以明確提出自己重點關心的問題,大模型據(jù)此關鍵要點進行引言梳理。
■ Q6: WaterScholar 生成的引言和總結是否可以直接用于論文?
WaterScholar 生成的引言和總結是基于文獻內(nèi)容的智能提取和整理,可以作為論文的參考素材。但建議您在使用前進行修改和完善,以確保符合論文的專業(yè)要求和風格。
■ Q7: 使用 WaterScholar 是否免費,訪問需要國外 VPN?
WaterScholar 完全免費,在國內(nèi)聯(lián)網(wǎng)條件下直接使用即可。
■ Q8: 如何提交使用反饋意見?
可進入問卷星(
https://www.wjx.cn/vm/t2VFw02.aspx),完成問卷需花費一分鐘左右,感謝您提出寶貴意見!
06
未來優(yōu)化升級計劃
隨著人工智能技術發(fā)展和科研需求的不斷變化,該項目將在北大環(huán)境學院以及相關領域推廣試用,持續(xù)優(yōu)化 WaterScholar 的功能與性能。主要計劃如下:
(1)完善文獻數(shù)據(jù)庫,補充中文期刊文獻數(shù)據(jù),增加更多的學術資源和數(shù)據(jù)支持;
(2)緊跟技術發(fā)展,增加大語言模型對長文本的支持能力;
(3)加強 RAG 技術的研究和應用,將目前的段落級別匹配提升為語句級別識別,提高智能處理的準確性和效率;
(4)升級 WaterScholar 為 AI Agent 模式,增加數(shù)據(jù)分析、多角色交互、調(diào)用外部工具等功能;
(5)優(yōu)化工具訪問速度。
相信 WaterScholar 將成為水科學研究領域不可或缺的重要工具,為科研工作者們提供更加便捷、高效的服務。誠邀廣大科研工作者們前來體驗 WaterScholar 的魅力,攜手推動水科學研究的進一步發(fā)展!請前往星河社區(qū)平臺使用,開啟您的智能科研之旅吧!
百度飛槳星河社區(qū)通過提供各類教育資源,包括課程、算力支持、開發(fā)工具與平臺、合作交流機會等多方面的服務,有力推動了各個高校不同專業(yè)領域的“AI+”應用發(fā)展。高校研究者和開發(fā)者可基于文心大模型進行模型訓練、工具開發(fā)、智能體開發(fā)等,建設教學、科研、管理等場景的應用。歡迎感興趣的高校與我們聯(lián)系,填寫以上問卷或發(fā)送郵件至paddle-up@baidu.com。