OpenDataLab 专注于从复杂PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态PDF转化为Markdown格式(如markdown、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为LaTex、保留文档结构,支持176种语言的准确识别,适用于学术、财务、法律等领域,兼容Windows/Linux/Mac平台。
Fish Audio Fish Audio是一款开源免费生成式 AI 文本转语音和语音克隆工具,具有强大、快速且可定制特性,专注于开发高质量的文本转语音模型,使用 VQ-GAN、Llama 和 VITS 等前沿 AI 技术,能够将文本转换为逼真的语音,提供强大且快速的文本转语音服务。