
資料內(nèi)容:
1.1 大模型 Agent 的定義與核心能力
大模型 Agent 是基于大語(yǔ)言模型構(gòu)建的具有自主決策、自主行動(dòng)能力的智能實(shí)體。它能
夠理解用戶需求,進(jìn)行任務(wù)規(guī)劃,調(diào)用相關(guān)工具和資源,與環(huán)境進(jìn)行交互,最終完成特
定的業(yè)務(wù)任務(wù)。
在美團(tuán)的業(yè)務(wù)場(chǎng)景中,大模型 Agent 具備以下核心能力:
● 自然語(yǔ)言理解能力:能夠準(zhǔn)確理解用戶通過(guò)文字、語(yǔ)音等方式表達(dá)的需求,包括復(fù)
雜的語(yǔ)義、情感和意圖。例如,在智能客服場(chǎng)景中,能夠理解用戶關(guān)于訂單問(wèn)題、退款
申請(qǐng)等各種表述。
● 任務(wù)規(guī)劃能力:對(duì)于復(fù)雜的用戶需求,能夠?qū)⑵浞纸鉃橐幌盗凶尤蝿?wù),并規(guī)劃出合
理的執(zhí)行順序和步驟。比如,在酒旅預(yù)訂場(chǎng)景中,根據(jù)用戶的出行時(shí)間、預(yù)算、偏好等,
規(guī)劃出合適的酒店、交通等預(yù)訂方案。
● 工具調(diào)用能力:能夠根據(jù)任務(wù)需求,自主調(diào)用美團(tuán)內(nèi)部的各種工具、系統(tǒng)和 API,
如訂單系統(tǒng)、支付系統(tǒng)、推薦系統(tǒng)等,以獲取所需的數(shù)據(jù)和資源,完成任務(wù)執(zhí)行。
● 環(huán)境交互能力:能夠與用戶、商戶、騎手等進(jìn)行實(shí)時(shí)交互,獲取反饋信息,并根據(jù)
反饋調(diào)整自己的行為和決策。例如,在騎手智能助手中,根據(jù)騎手的實(shí)時(shí)位置和路況信
息,調(diào)整配送路線。
● 學(xué)習(xí)與進(jìn)化能力:通過(guò)不斷地與業(yè)務(wù)場(chǎng)景交互和數(shù)據(jù)積累,能夠持續(xù)學(xué)習(xí)和優(yōu)化自
身的模型和策略,提升任務(wù)處理的準(zhǔn)確性和效率。