-
-
Notifications
You must be signed in to change notification settings - Fork 843
Open
Labels
enhancementNew feature or requestNew feature or request
Description
描述
目前部分多模态的大模型已经支持了音频输入,比如谷歌gemini,阿里的Qwen-Omni等。希望可以让bot获取用户发送的语音,直接作为音频提示词发送给大模型
使用场景
比如在qq私聊时,可以直接给bot发语音,然后bot把系统提示词和用户语音文件一起发送给大模型生成回复
你愿意提交PR吗?
- 是的, 我愿意提交PR!
Code of Conduct
- 我已阅读并同意遵守该项目的 行为准则。
AlanBacker, Yukikaze166 and Huanghun542
Metadata
Metadata
Assignees
Labels
enhancementNew feature or requestNew feature or request