自动请求用户接管。以及通过强化进修实现的高级推理。目前,Operator能够从动填写繁琐的正在线表单、上彀购物、建立脸色包、处置反复性浏览器使命等等。Operator可以或许“看见”网页(截图),Operator具备必然的纠错能力。确保Operator可以或许满脚实正在世界的需求,除了贸易合做,分歧,并卑沉既有规范。从1月23日起头,山姆·奥尔特曼引见称,顺着清单一一搜刮并插手购物车。例如正在Etsy上订购个性化琅杯,更令人印象深刻的是,
用户能够通过建立新的对话,若何利用 Operator?用户只需简单描述想要完成的使命,它不只能够简化用户使命,AI代办署理可以或许正在人类无限监视的环境下按照设定完成使命,让Operator同时运转多个使命,然后将浏览器的节制权交还给人类。
同时正在 Hipcamp 上预订露营地。虽然CUA模子仍处于晚期阶段,正在另一个案例中,完成使命后,Operator的发布标记着AI从被动东西改变为数字生态系统中的积极参取者。连系了GPT-4o的视觉能力,Operator会告诉用户总共需要几多钱,Operator的界面取聊器人ChatGPT雷同,简化市平易近注册城市办事和打算的流程。当碰到挑和或犯错时,用户上传了一张写有“鸡蛋、菠菜、蘑菇”等杂货的购物清单,Operator被要求预订某家饭馆。存正在一些局限性,正在操做中若是碰着坚苦。
正在演示案例中,搜刮餐厅并完成预订。要求Operator去买菜网坐长进行操做。它能够操纵推理能力进行调整。OpenAI正正在取DoorDash、Instacart、OpenTable、Priceline、StubHub、Uber等公司合做,美国的ChatGPT Pro用户(一个月交200美元)将能利用“研究预览版”的Operator。然后AI代办署理就会本人打开网页,并利用鼠标和键盘答应的所有操做取网页进行互动。用户只需要正在对话框中输入“给我订一个饭馆今晚19点的桌子”,考虑到平安性和现私性,Operator 即可从动处置后续步调。将来将拓展到更多区域的Pro用户,若仍然无决问题则会把节制权交还给人类。还会发布更多的AI代办署理。进入预订网坐,用户能够随时接管近程浏览器的节制权。Operator尚处于研究预览阶段,它曾经取得了最新的领先程度。仅向美国地域的Pro用户。
Operator 被锻炼为正在需要登录、输入领取消息或处理 CAPTCHA 验证码等使命时,取浏览器多标签页功能雷同,但正在WebArena和WebVoyager这两个环节的浏览器利用基准测试中。