Android 语音合成

时间:2022-06-18 灵魂的沉浮人气:0

简介

科大讯飞：合成速度快，准确度高，模型多。但问题也是相当明显，只有在线合成是免费的，离线则是一笔不小的开销。

百度：是专门为他的导航做的一套，性能相对也还可以，但是他只支持离在线混合模式，默认是在wifi情况下是使用在线模式，4g或无网络情况下使用离线模式。

云知声：则可以实现完全的离线合成模式，相比于前两个，性能可能没那没完美，不过对合成的语音要求不高的应用来说，可以考虑接入，缺点就是模型比较少。

在线合成和离线合成（合成速度）

在线合成必须将数据传到第三方平台，调用他们的服务接口进行合成，这中间牵扯到网络状况，在网络良好的情况下，合成速度和离线模式没有太大的差别，但是有时候服务器也会来开个小差，无法保证网络一直都是畅通无阻的。在线模式虽然不太稳定，但是不需要把模型和合成底层代码放在本地，离线合成虽然稳定快速，但是apk体积增加的有点小夸张。

云知声的解决办法：把语音合成模型放在服务器后端，你要使用的时候下载到本地。

集成方法

注册云知声开发者，创建应用，下载离线语音合成sdk，里面就两个文件。

将这里面的所有东西都拷贝到你的项目的对应的libs下（比如app目录下的libs）

在app模块的 build.gradle的defaultConfig括号下加上

        ndk {
            abiFilters 'armeabi'
        }
        sourceSets {
            main {
                jniLibs.srcDirs = ['libs']
            }
        }

截图如下：

在AndroidManifest.xml设置所需要的权限

    <!-- 网络权限 -->
    <uses-permission android:name="android.permission.INTERNET"/>
    <!-- sd卡获得写的权限 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
    <!-- 获取网络状态 -->
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
    <!-- 获取WiFi状态 -->
    <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
    <!-- 改变网络状态 -->
    <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>
    <!-- 改变WiFi状态 -->
    <uses-permission android:name="android.permission.CHANGE_WIFI_STATE"/>
    <!--唤醒锁定-->
    <uses-permission android:name="android.permission.WAKE_LOCK"/>
    <!--清除应用缓存-->
    <uses-permission android:name="android.permission.RECORD_AUDIO"/>
    <!--麦克风权限组-->
    <uses-permission android:name="android.permission.READ_CALENDAR"/>
    <!-- 允许应用写（非读）用户的外部存储器 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
    <!--允许读取电话的状态-->
    <uses-permission android:name="android.permission.READ_PHONE_STATE"/>
    <!--允许应用读取用户的联系人数据-->
    <uses-permission android:name="android.permission.READ_CONTACTS"/>
    <!--允许使用电源锁定管理以使进程休眠或屏幕变暗-->
    <uses-permission android:name="android.permission.WAKE_LOCK" />

为了方便使用我这里将云知声语音合成做了进一步的封装，以方便调用，以下是示例，方便大家进行参考

import android.content.Context;
import android.media.AudioManager;
import android.util.Log;

import cn.yunzhisheng.tts.offline.TTSPlayerListener;
import cn.yunzhisheng.tts.offline.basic.ITTSControl;
import cn.yunzhisheng.tts.offline.basic.TTSFactory;
import cn.yunzhisheng.tts.offline.common.USCError;

/**
 * 云知声离线语音封装类
 */
public class SpeechUtilOffline implements TTSPlayerListener {
    public static final String TAG ="SpeechUtilOffline";
    public static final String appKey = "_appKey_";
    private ITTSControl ittsControl;
    private Context context;
    public SpeechUtilOffline(Context context) {
        this.context = context;
        init();
    }

    /**
     * 初始化引擎
     */
    private void init() {
        // 初始化语音合成对象
        ittsControl = TTSFactory.createTTSControl(context, appKey);
        // 设置回调监听
        ittsControl.setTTSListener(this);
        // 设置音频流
        ittsControl.setStreamType(AudioManager.STREAM_MUSIC);
        // 设置播报语速,播报语速，数值范围 0.1~2.5 默认为 1.0
        ittsControl.setVoiceSpeed(2.5f);
        // 设置播报音高,调节音高，数值范围 0.9～1.1 默认为 1.0
        ittsControl.setVoicePitch(1.1f);
        // 初始化合成引擎
        ittsControl.init();
    }

    /**
     * 停止播放
     */
    public void stop(){
        ittsControl.stop();
    }

    /**
     * 播放
     */
    public void play(String content) {
        ittsControl.play(content);
    }

    /**
     * 开始缓冲回调
     */
    @Override
    public void onBuffer() {
        Log.i(TAG, "onBuffer");
    }

    /**
     * 开始播放回调
     */
    @Override
    public void onPlayBegin() {
        Log.i(TAG, "onPlayBegin");
    }

    /**
     * 取消播放回调
     */
    @Override
    public void onCancel() {
        Log.i(TAG, "onCancel");
    }

    /**
     * 语音合成错误回调
     */
    @Override
    public void onError(USCError uscError) {
        Log.i(TAG, "onError");
    }

    /**
     * 播放完成回调
     */
    @Override
    public void onPlayEnd() {
        Log.i(TAG, "onPlayEnd");
        ittsControl.stop();
    }

    /**
     * 初始化成功回调
     */
    @Override
    public void onInitFinish() {
        Log.i(TAG, "onInitFinish");
    }
}

使用方法

SpeechUtilOffline speechUtilOffline = new SpeechUtilOffline(this);
speechUtilOffline.play("此处是需要播放的文本内容")

总结

在集成的时候遇到过很多bug，比如模型文件放在不正确的地方会导致没有声音，模型文件不完整的时候回导致程序崩溃，发音不是预期的效果等等，还有一些参数的设置，具体参数还是得看官方的开发文档。

加载全部内容