在这里的Agent,需要在一个工作流完善标准的场景下才能进行构建,因为构建的第一步就是人为的为整个工作流相处步骤,细化每一步是否能被LLM或者某个函数,调用API所解决,当无法一步完成某个步骤的时候再分解这个步骤,直到可以解决为止。

例如将发票记录在数据库当中的一个步骤:

  • 用OCR识别发票转化为Markdown
  • 将Markdown中的要加入的数据转化为SQL语句
  • LLM调用CLI,输入SQL语句,插入某个数据库