本样子由清华大学鲁继文陶冶团队的张博、张博睿、江承昊、史明磊,以及极佳视界的时间团队共同完成。研究团队热忱迎接社区反应与时间孝敬,期待与大师建立者共同拓展智能体在数字使命场景中的诈欺鸿沟。Syll 是一个居住在你电脑屏幕边的智能体,它匡助照管那些差点被淡忘的草稿、文献、旧像片和未竟之事。要是你讲理教它一次,它会记着旅途:那儿需要看,那儿需重点,何时敲号召,何时用器用。下一次,它就能沿着你留住的印迹完成任务。Syll 不单会点屏幕,也不单会调用接口。GUI、CLI、MCP 齐是它不错走的小路;你仍然不错随时停驻它、查验它、再行教它。愿它成为你的伙伴,而不是替你作念主的机器。

现时个东说念主 AI 智能体靠近界面割裂、教授门槛高、引申不透明、狡饰与定制穷苦等问题。多量 AI 系统主要依赖 API 或号召行完成任务,难以障翳闭源桌面软件;平庸用户也很难用低门槛方式教授 AI 完成我方的使命经过;引申过程穷乏直不雅可查的依据,云表决策还可能带来数据安全与二次建立受限等问题。

为惩处这些难题,清华大学智能视觉本质室团队开源了多模态全交互智能体框架 Syll。Syll 复古 GUI、CLI、MCP/API 等多种操作方式,并通过长入多模态引申才智、GUI 手段示教、全程可审计跟踪与土产货模块化架构,打造更易用、更确切、更安全且更稳健二次建立的个东说念主自动化智能体框架。

Syll 的中枢策画理念包括:

Syll 具备长入的多模态引申才智,原生兼容 MCP/API、号召行 CLI 与视觉 GUI 三种操作方式,开云kaiyun中国官网入口粗略凭据不同任务场景选拔合适的引申旅途,罢了更纯真实电脑操控。

Syll 复古「示教即手段」机制。用户无需编写代码或手动设定复杂规矩,只需把任务手动操作一遍,Syll 便可自动录制经过、索要关节循序,并将其千里淀为可复用的智能体手段。

Syll 搭配多模态审计体系,AI 引申的每一步操作齐会留住显着可查的记载,全程透明可视化,让使用过程看得见、更确切。

Syll 给与土产货模块化架构,龙虎下载官方版用户的挂念、手段、规矩及个东说念主偏好齐不错以可剪辑文献的花样存储在土产货,既保险数据狡饰安全,又具备较高的推广性。

Syll 策画开头不是在 GUI、CLI、MCP 之间选拔,而是把它们放进合并个引申回路:需要不雅察界面时走 GUI,需要批量处理时切 CLI,需要纠合作事时走 MCP/API。这么酿成一个更完好的看成空间,让智能体在不同使命名义之间当然流转。

Syll 把 GUI 截止视为看成空间的一部分,而不是 API 不成用时的临时补丁。它需要学会不雅察屏幕、定位主义、处理弹窗、恭候气象变化,并在符合的时间切换到号召行或器用接口,幸免把系数问题齐变成粗劣的点击。

Syll 选拔了另一条更当然的旅途:示教即手段。用户照习气把事情作念一遍,Syll 在后台记载关节视觉锚点、鼠标键盘窗口气象变化、任务险峻文等信息,生成可复用的手段。学到的是「奈何完成任务」,而不是稀少的按钮坐标。

Syll 的引申过程会留住可查验的轨迹,确保每次屏幕操作与界面气象变更均可被记载、回放与审计。用户永久保有对关节决策的最终把控权,酿成机器引申到东说念主审核的考证闭环,晋升自动化后果的同期确保系统的可控性与可阐发性。
Syll 的挂念、手段、规矩和偏好齐以土产货可剪辑文献的花样组织。对平庸用户来说,在前端面板就能完成模子成立、手段料理、定时任务和平常对话。对建立者来说,Syll 的工程特色是高度模块化与可推广性,提供雅致的代码基础。
Syll 仍然处在早期 public alpha,会合手续珍惜和迭代龙虎下载2026最新版,复古更多真正任务,同期保合手框架的通俗性与可推广性,也迎接社区进行二次建立。它会少许点变得更懂你,偶然帮你完成复杂经过,偶然仅仅轻轻教导一句。