现在遇到的问题是 html 往往很大,甚至可以说体积是超级超级大,几百KB甚至几MB 但是 LLM 的上下文比较小,输入的 html 这么大,非常的糟糕 但是又不能去除掉所有的 html 标签,因为这样就是失去了原始信息了,怎么有选择性的把有效且精简的数据输入给 llm 呢?
阅读量:329
点赞量:12