[AI Embedchain] API手册 Add

add() 方法用于从不同的数据源加载数据到RAG管道中。下面是它的签名:

使用

从网页加载数据

代码示例

1
2
3
4
5
6
from embedchain import App

app = App()
app.add("https://www.forbes.com/profile/elon-musk")
# 在chromadb中插入批次: 100%|███████████████| 1/1 [00:00<00:00,  1.19it/s]
# 成功保存 https://www.forbes.com/profile/elon-musk (DataType.WEB_PAGE). 新块计数: 4

从站点地图加载数据

代码示例

1
2
3
4
5
6
7
from embedchain import App

app = App()
app.add("https://python.langchain.com/sitemap.xml", data_type="sitemap")
# 加载页面: 100%|█████████████| 1108/1108 [00:47<00:00, 23.17it/s]
# 在chromadb中插入批次: 100%|█████████| 111/111 [04:41<00:00,  2.54s/it]
# 成功保存 https://python.langchain.com/sitemap.xml (DataType.SITEMAP). 新块计数: 11024

你可以在这里找到所有支持的数据源的完整列表here