项目简介
“云游四方”是一款旅游景点解说APP,借助百度的语音合成、语音识别以及高德地图的人工智能API,为自由行用户在景区旅游时提供景点解说服务,扮演云导游的角色,让用户在旅程中获取有趣的知识和故事,旨在填补国内自助导游类/具有旅游解说功能的旅游出行软件市场空白。
项目的主要特性和功能
- 语音识别与合成:精准识别60秒以内语音为文字,提供高拟人和流畅自然的语音合成服务,支持中文普通话、中英文混读播报,有多种音色可选,还支持自主标音和离线在线融合模式。
- 地标识别:可识别约12万中外著名地标、景点,用户上传照片可识别当地标志性建筑物并了解其历史和故事,但对图片清晰度要求高,最新完工建筑暂无法识别。
- 地图功能:能定位当前位置,点击地图标记点查看相关资料,具备隐藏文字标注、多信息弹窗/气泡效果、地图选点、地点查询等功能,方便查找景点解说语音。
- 社交功能:驴友页可让用户在旅行中结交新朋友,展示当前旅游景区。
- 个性化设置:“我的”页面可自由设置软件主题风格、语音播放速度等功能。
安装使用步骤
1. 安装必要的库
使用pip(Python的包管理器)安装所需第三方库,在命令行输入:
bash
pip install requests
2. 配置API密钥
打开项目源码中的tts.py
文件,将API密钥和秘钥的占位符替换为在百度开发者平台申请的实际密钥和秘钥。
3. 运行脚本
在命令行导航到源码文件所在目录,运行Python脚本:
bash
python tts.py
4. 定制合成参数(可选)
可按需修改tts.py
文件中已定义的合成参数,如文本内容(TEXT)、发音人选择(PER)、语速(SDP)、音调(PIT)和音量(VOL)。
5. 查看结果
运行脚本后,根据输出查看结果文件。正常会生成音频文件(如result.mp3
)可直接播放;若出错则生成错误文件(如error.txt
),可查看错误信息。
注意事项
- 确保正确安装所有必要的库。
- 确保使用的API密钥和秘钥正确且有访问百度语音合成API的权限。
- 按需调整合成参数以获得最佳语音效果。
- 遇到问题可查看项目文档、示例或寻求社区支持。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】