想kimi,deepseek网页上传pdf文件也可以转成文本,他是内置OCR还是怎么做到的
核心肯定是ocr,具体流程那就不清楚了 第一步肯定是ocr来识别pdf的内容,然后进行算法解析内容,这个具体的文本算法不知道是啥 它肯定具备了格式转换之类的工具 比如空格,换行符调整等等让文本内容更加能够解析到