申领指南
1NVIDIA
注册地址:
https://build.nvidia.com/
虽然是英文网站,但注册很简单,右上角的【Login】点一下,输入邮箱,跟着提示就可以完成:

而后会提示你输入手机号码,记得选【China】,填入你的手机号码,如果没有提示,你的页面顶部一定会有一行英文【Verify your account to unlock API access】,点击【Verify 】同样选择【China】再输入手机号码,填入验证码即可。
然后系统就会提示你创建API Key,这里点击【Generate Key】:

如果没有跳出来也没关系,到页面右上角,点击你的昵称图标,选择【API Keys】,自行创建一个,名称也就是【name】随便填,【Expiration】记得选【Never Expire】。
NVIDIA是限速(次)策略,所以没有用量限制。
⚠️ 重要提醒:NVIDIA的API Key生成后一定一定一定记得复制!因为只显示一次,后期也无法复制!格式为nvapi-xxxxxx-xxxxxx。
2智谱清言(GLM)
注册地址:
https://open.bigmodel.cn
注册完成后到控制台 → API 密钥 → 创建密钥即可,这个不用复制,后期还可以在API Key页面复制。
看用量在控制台页面下划到【资源包】卡片,点击【查看全部】就可以了。

3美团(LongCat)
注册地址:
https://longcat.chat
注册完成立即进入用量页面,点击左侧边栏的【API Keys】创建即可,后期也是可以复制的。

配置指南
配置方法基本一样,我就以龙猫为例吧。
点击WorkBuddy模型对话框(图中Auto图标):

选择最下面的【+配置自定义模型】:

选择最下面的【自定义/Custom】:

【提供商】不用管,填入【接口地址】、【API KEY】、【模型名称】,勾选高级配置,保存:

🔗 三个模型的【接口地址】
NVIDIA:
https://integrate.api.nvidia.com/v1
GLM:
https://open.bigmodel.cn/api/paas/v4
LongCat:
https://api.longcat.chat/openai
🔗 【模型名称】和限制:
NVIDIA有120多个模型,大部分都是国外的用不了,所以还是推荐几个常用的国产模型:glm-5.1,kimi-k2.6,minimax-m2.7,deepseek-v4-pro,每分钟请求次数限制40 RPM,不限制调用上限。GLM有两个专用模型和一个通用模型,具体可以在用量页面查看,免费时限3个月,glm-4.5-air是纯文本,有1200万token额度,glm-4.6v是多模态,有600万token额度,通用额度是200万,应该可以用几次glm-5.1吧。
LongCat有两个档位,每日都有大量免费额度,没用完则当日清零,用久了还能申请把50万额度升级到500万:

轻量级选lite,文本选chat,推理选thinking,Omni则是全模态,具体名称请在用量页面复制。
🎯 一个小技巧
按照上述配置,就可以在WorkBuddy中正常调用配置好的模型了。
你可以把所有模型都像上面那样一个个添加进去,也可以随时点击模型对话框,选择【+配置自定义模型】,然后点击【取消】,这样就可以编辑你配置过的模型了,点击要编辑的模型后面的编辑图标:

此时你在同一个大模型配置中,修改【模型名称】即可换模型了。
例如在龙猫配置界面把【LongCat-Flash-Lite】改成【LongCat-Flash-Chat】,然后点击【保存】。

这样你就可以调用chat模型了,不过这个chat模型刚开始只有50万额度,几分钟就没了,只能等用段时间去申请提额了。多说一句,其实lite的5000万额度也用不了多久。
最后谈一下个人体验
虽然龙猫能力目前弱于另外两个,但使用感受上,总体来说龙猫最值得推荐。
不仅是因为龙猫的额度,还因为在我使用过程中,NVIDIA经常报错,可能是网络的问题,毕竟是外国公司;GLM经常没响应,可能是用的人太多了;只有龙猫相对正常,虽然偶尔不动,但停止再继续基本上就好了。
不过GLM能用的情况下,必须是优先GLM,三个月有效期得抓紧用,而且功能强大,至少目前比龙猫强很多。
据说小米的大模型比较好用,能力也很强,如果你拿到了,也可以参照上面的配置方法。如果没拿到,也可以去这里试试,祝你成功:
https://100t.xiaomimimo.com/