虚拟列表 防抖 (Debounce):AI流式输出会每秒有多次更新,我们可以设置一个缓冲区,将新的消息放进缓冲区,再进行一次状态更新 markdown 性能高亮优化:利用Web Worker来处理代码高亮逻辑或者用其他轻量级的解析方案 AI 返回 token 时,如果后端推送速度>前端渲染速度时,可以创建一个缓冲区,利用requestAnimationFrame,在微任务处理完成过后执行传入的回调函数,这个回调函数会根据队列里面累计的 token 数来动态的渲染多少个字