Chat with Wiki - dify如何将一个pdf文件上传到知识库中，pdf文件中包含图文信息

Answer

要将一个包含图文信息的 PDF 文件上传到知识库中，您可以按照以下步骤操作：

在文本格式页签下，选择本地文档，然后单击下一步。
将要上传的 PDF 文件拖拽到上传区，或单击上传区域选择要上传的文件。
- 注意事项：
  - 目前支持上传.txt、.pdf、.docx 格式的文件内容。
  - 每个文件不得大于 20M。
  - 一次最多可上传 10 个文件。
当上传完成后单击下一步。
选择内容分段方式：
- 自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。
- 自定义：手动设置分段规则和预处理规则。
  - 分段标识符：选择符合实际所需的标识符。
  - 分段最大长度：设置每个片段内的字符数上限。
- 文本预处理规则：
  - 替换掉连续的空格、换行符和制表符。
  - 删除所有 URL 和电子邮箱地址。
单击下一步完成内容上传和分片。

Content generated by AI large model, please carefully verify (powered by aily)

References

|上传方式|操作步骤||-|-||本地文档|1.在文本格式页签下，选择本地文档，然后单击下一步。 2.将要上传的文档拖拽到上传区，或单击上传区域选择要上传的文档。 目前支持上传.txt,.pdf,.docx格式的文件内容。 每个文件不得大于20M。 一次最多可上传10个文件 1.当上传完成后单击下一步。 2.选择内容分段方式： 2.1.自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。 2.2.自定义：手动设置分段规则和预处理规则。 分段标识符：选择符合实际所需的标识符。 分段最大长度：设置每个片段内的字符数上限。 文本预处理规则： 替换掉连续的空格、换行符和制表符 删除所有URL和电子邮箱地址 1.单击下一步完成内容上传和分片。|

创建并使用知识库

|上传方式|操作步骤||-|-||Notion|1.在文本格式页签下，选择Notion，然后单击下一步。 2.单击授权。 首次导入Notion数据和页面时，需要进行授权。 1.在弹出的页面完成登录，并选择要导入的页面。 2.选择要导入的数据，然后单击下一步。 3.选择内容分段方式： 3.1.自动分段与清洗：系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据。 3.2.自定义：手动设置分段规则和预处理规则。 分段标识符：选择符合实际所需的标识符。 分段最大长度：设置每个片段内的字符数上限。 文本预处理规则： 替换掉连续的空格、换行符和制表符 删除所有URL和电子邮箱地址 1.单击下一步完成内容上传和分片。||自定义|1.在文本格式页签下，选择自定义，然后单击下一步。 2.输入单元名称，然后单击确认。 3.单击创建分段，然后在弹出的页面输入要上传的内容。 每个分段最多可添加2000个字符。 1.单击保存。|