【OneAPI】网页搜索API和网页正文提取API
OneAPI接口更新啦,本次新增了2个API:网页搜索和网页正文提取。
这两个接口全都使用Rust实现,可本地部署,永久授权。
以下是API的详细介绍。
网页搜索(WebSearch)
基本信息
API简介
搜索指定关键词的网页。
API信息
接口地址:https://oneapi.coderbox.cn/openapi/api/webpage/search
请求方式:GET
调用类型:同步
认证方式:AccessToken
频率限制:不限制
请求参数
公共参数
参数名 | 类型 | 位置 | 必填 | 含义 | 说明 |
---|---|---|---|---|---|
AccessToken | string | header | 是 | 接口访问凭证 | 需在“应用管理”中创建应用后获取AccessToken。 |
接口参数
URL参数
参数名 | 类型 | 必填 | 含义 | 说明 |
---|---|---|---|---|
q | string | 是 | 关键词 | - |
count | number | 否 | 搜索数量 | 默认10条,最大支持100条 |
响应参数
参数名 | 类型 | 必填 | 含义 | 说明 |
---|---|---|---|---|
title | string | 是 | 网页标题 | - |
url | string | 是 | 网页链接 | - |
summary | string | 是 | 网页概要 | - |
网页正文提取
基本信息
API简介
提取任意网页的正文内容,支持使用算法提取、AI提取以及混合提取,并自动将提取到的内容转为markdown格式。
- 算法提取:使用传统算法进行抽取,准确度约90%,可能会出现非正文内容,但速度快,适合需要快速提取的场景。
- AI提取:使用AI提取网页的正文内容,准确度可达99%。
- 混合提取:识别网页主内容区域后,使用AI提取,准确度可达99%。
API信息
接口地址:https://oneapi.coderbox.cn/openapi/api/webpage/extract
请求方式:GET
调用类型:同步
认证方式:AccessToken认证
频率限制:不限制
请求参数
公共参数
参数名 | 类型 | 位置 | 必填 | 含义 | 说明 |
---|---|---|---|---|---|
AccessToken | string | header | 是 | 接口访问凭证 | 需在“应用管理”中创建应用后获取AccessToken。 |
接口参数
URL参数
参数名 | 类型 | 必填 | 含义 | 说明 |
---|---|---|---|---|
url | string | 是 | 网页地址 | - |
fetch_type | string | 否 | 网页加载方式 | 支持静态网页和动态网页,取值static 、dynamic |
extract_type | string | 否 | 正文提取方式 | 支持传统算法提取、AI提取或混合提取。取值algorithm 、ai 、mix 。算法提取速度块,ai提取或混合提取准确度高,可按需选择 |
响应参数
参数名 | 类型 | 必填 | 含义 | 说明 |
---|---|---|---|---|
title | string | 是 | 网页标题 | - |
url | string | 是 | 网页链接 | - |
content | string | 是 | 正文内容 | markdown格式 |
详细的接口文档可参考:
- 网页搜索:https://oneapi.coderbox.cn/doc/2671920283879937
- 网页正文提取:https://oneapi.coderbox.cn/doc/2671958859057666