Cortana'的帮助列表需要什么图标?
所以我在应用程序中使用Cortana添加语音命令识别.我的VCD文件都设置了,一切都按预期工作,所以现在我必须寻找小东西. 我在应用程序中有所有所需的图标(我知道),但是当我的应用显示在Cortana屏幕上("我能说什么?"屏幕)时,我的应用程序带有默认图标,未添加由我. 所以我的问题是,我没有看到什么缺少的图标? p.s:官方远程桌面应用程序也显示了相同的图标,所以我想我不是唯一一个缺少图标的图标:) 解决方案 因此,根据 Rob Caplan 这是Windows Phone Runtime应用程序的已知问题,不会影响Silverlight应用程序.您无能为力地从代码中更改它.我们正在研究解决OS的将来更新的修复程序. 来源:
0 2023-12-08
编程技术问答社区
紧凑型框架语音识别API或库
到目前为止,我的研究告诉我,没有免费的库可供声音识别. 这仍然是一个案例(因为我发现的所有帖子都是过去的几年). 是否有示例应用程序,或者如果我想让我的winmobile C#应用程序可以开始 从输入中识别声音. 解决方案 我知道的唯一可与Windows Mobile一起使用的库,紧凑型框架是其他解决方案 请看一下 http://www.microsoft.com/www.microsoft.com/.aspx Microsoft offer free implementations, but they aren't available on Windows Mobile .
0 2023-12-08
编程技术问答社区
Python 语音识别
我目前正在研究Python 3.3的虚拟助理程序,我想将语音识别纳入其中.有人知道使用任何Python模块或工具吗?任何帮助将不胜感激! 解决方案 我花了很多时间从事这个主题. 目前,我正在开发一个Python 3开源跨平台虚拟虚拟助理程序,称为用户可以像Siri,Cortana或Amazon Echo一样使用它. 它还使用了一个非常简单的"模块"系统,用户可以轻松编写自己的模块以增强其功能.让我知道是否可以使用. 否则,我建议您查看Google的Python语音到文本和文本到语音包. 可以通过使用命令来安装两个软件包: pip install SpeechRecognition gTTS Google Stt: https://pypi.py.python.org/pypi/pypi/pypi/speechrecognition/ Google TTS: https://pypi.python.org/pypi/pypi/gtts/1.0.
0 2023-12-05
编程技术问答社区
python webrtc的语音活动检测是错误的
我需要进行语音活动检测作为对音频文件进行分类的步骤. 基本上,我需要肯定地知道给定音频是否使用语言. 我正在使用py-webrtcvad,我在git-hub中找到,几乎没有记录: https://github.com/wiseman/wiseman/py-webrtcvad 的事情是,当我在自己的音频文件上尝试它时,它可以与具有语音的音频文件一起使用,但是当我用其他类型的音频(例如音乐或鸟类声音)喂食时,它会产生误报.将侵略性设置为3. 音频是8000个样本/Hz 我更改为源代码的唯一一件事就是将参数传递给主函数的方式(不包括SYS.Args). def main(file, agresividad): audio, sample_rate = read_wave(file) vad = webrtcvad.Vad(int(agresividad)) frames = frame_generator(30, audio, s
0 2023-12-01
编程技术问答社区
比较安卓中的语音WAV或语音标签(语音命令)API
我正在开发一个应用程序,我需要某种方法来比较2个声音,无论是否匹配,我知道语音识别器是一种做到这一点的方法首先,除了语音识别器支持的范围外,它不适合其他语言....有什么想法吗?就像过去的手机一样 解决方案 a 相对简单的方法是使用FFT(快速傅立叶变换)将原始WAV文件的时间域数据转换为频域数据(每个数据都转换的阵列中的值表示特定频带的相对大小/强度). 如果同一个人两次说相同的单词,则在两个WAV文件中,由此产生的时间域数据仍将非常不同.将两个WAV文件转换为频域(使用两者的FFT窗口的大小相同,即使两个文件的长度略有不同)也会产生频率数组,而频率数组与彼此的相似性要比原始的WAV文件更相似./p> 不幸的是,我找不到专门针对Android的FFT库.这是一个引用一些基于Java的库的问题: java中的信号处理库? 其他解决方案 一个想法正在比较声音在其光谱中的相似性.频谱图中的特征是强大的,并且可以抵抗噪声,这是分析两个声音的良好参考. 如果采用这种方法
0 2023-11-27
编程技术问答社区
保存Android Stock语音识别引擎的音频输入
我试图将Android语音识别服务收听的音频数据保存在文件中. 实际上我实现了RecognitionListener,如下所示: on android上的文字 如下所示,将数据保存到缓冲区中: 捕获发送给Google语音识别服务器的音频 ,将缓冲区写入WAV文件,如这里. android record awnroid record raw to raw to raw to raw to raw to raw to Wave File in Wave File for HTTP Streaming 我的问题是如何获得适当的音频设置以保存在WAV文件的标题中. 实际上,当我播放WAV文件时,只有此参数听到奇怪的噪音, short nChannels=2;// audio channels int sRate=44100; // Sample rate short bSamples = 16;// byteSample 或没有这样的: short
2 2023-11-27
编程技术问答社区
在MSR身份识别工具箱(fopen)中出错
我尝试使用Error using fread Invalid file identifier. Use fopen to generate a valid file identifier. Error in htkread (line 7) nframes = fread(fid, 1, 'int32'); % number of frames Error in mapAdapt>load_data (line 107) data{ix} = htkread(filenames{ix}); Error in mapAdapt (line 52) dataList = load_data(dataList); Error in demo_gmm_ubm (line 69) gmm_models{spk} = mapAdapt(spk_files, ubm, map_tau, config); 代码的一部分导致错误如下: function data = load_data(dat
2 2023-11-25
编程技术问答社区
将GMM-UBM的分数转换为等效的准确率百分比
我为扬声器识别目的构建了一个GMM-UBM模型.适用于每个说话者的模型的输出,通过对数似然比计算得出的一些分数.现在,我想将这些似然得分转换为0到100之间的同等数字.有人可以指导我吗? 解决方案 没有直接的公式.您可以做简单的事情,例如 prob = exp(logratio_score) ,但这些可能无法反映您数据的真实分布.您的样品的计算概率百分比不会均匀分布. 理想情况下,您需要获取一个大数据集并收集有关您对分数的接受/拒绝率的统计信息.然后,一旦构建直方图,您就可以通过该频谱图将得分差异标准化,以确保如果您看到一定的分数差异,则可以接受30%的主题.该归一化将使您能够创建均匀分布的概率百分比.请参阅例如如何如何在存在零细胞的情况下,计算2x2表的似然比的置信区间 这个问题在扬声器识别系统中很少解决,因为置信区间不是您真正想要显示的.您需要一个简单的接受/拒绝决定,为此,您需要知道虚假拒绝和接受费率的数量.因此,仅找到一个阈值,而不是建立整个分布是足
0 2023-11-25
编程技术问答社区
安卓系统中的语音活动检测
我正在编写一个应用程序,该应用程序的行为将与现有的语音识别类似,但会将声音数据发送到专有的Web服务以执行语音识别部分.我使用的是标准的Mediarecord(已编码AMR-NB),这似乎是语音识别的完美选择.此提供的唯一数据是通过 getMaxAmplitude() methot. 我正在尝试检测该人何时开始说话,以便当该人停止说话大约2秒钟时,我可以继续将声音数据发送到Web服务.现在,我正在使用一个阈值来振幅,如果它越过值(即1500),那么我认为该人在说话.我担心的是,振幅水平可能因设备而有所不同(即Nexus One V droid),因此我正在寻找一种可以从振幅值得出的更标准的方法. . P.S. 我看了看 graphing-agplitude ,但它并没有提供仅使用幅度进行操作的方法. 解决方案 好吧,这可能没有太大帮助,但是从应用程序通过测量设备麦克风捕获的偏移噪声开始,并基于此动态应用阈值?这样,您将使其适应不同设备的麦克风,也可以适应用户在给定时间使
0 2023-11-25
编程技术问答社区
文件未找到的异常?(语音recog)
对不起,我对这个问题有一个月的时间,我想提供尽可能多的细节...它只是一个简单库中找不到的例外...:) 我在我的variances文件上找不到文件: 我确实有差异文件: 我试图在我的背景服务中简单地实现语音识别,以便可以检测到用户何时说hello(使用pocketsphinx). 问题发生在此方法中:createSphinxDir(); 这是我的服务: @Override public void onCreate() { super.onCreate(); setupRecog(); } private void setupRecog() { String sphinxDir = createSphinxDir(); Log.v(TAG, "ABOUT TO CREATE SETUP"); if (sphinxDir != null) { try
0 2023-11-25
编程技术问答社区
如何利用编程启动bibxy活动?
我正在使用S8/S8+.我想从意图调用Bibxy应用程序.但是,我无法称呼它.我该如何从意图中称呼它? 这就是我尝试的 final String SVOICE_PACKAGE_NAME = "com.samsung.voiceserviceplatform"; final Intent intent = new Intent(); intent.setPackage(SVOICE_PACKAGE_NAME); intent.setAction(Intent.ACTION_VOICE_COMMAND); intent.setFlags(Intent.FLAG_ACTIVITY_NEW_TASK | Intent.FLAG_ACTIVITY_CLEAR_TOP); getApplication().startActivity(intent); 解决方案 这对我有用: startActivity(new Intent(Intent.ACTION_VOICE_COMMAN
0 2023-11-25
编程技术问答社区
在进行识别之前,至少要加载一个语法。
您好,我尝试创建简单的AI程序,因此我定义了两个语法并加载它们,并且在识别识别之前必须加载一个错误. Visual Studio的错误是: 类型" system.invalidoperationException"类型的例外发生在system.speech.dll中,但在用户代码中没有处理 其他信息:在识别识别之前,必须至少加载一种语法. 这是代码 这是班级 class DefineGrammar { /// /// Define Choices /// Choices greeting; Choices DateAndTime; /// /// Define the Grammar var /// Grammar greetingGrammar; Grammar DateAndTimeGrammar;
0 2023-11-25
编程技术问答社区
一个Chrome扩展程序如何获得用户的许可来使用用户的计算机的麦克风?
如果我们在Chrome上的网站上以下面的网站上的HTML5的Web Speech API的JavaScript代码运行,Chrome将要求使用用户使用用户的计算机的麦克风的许可. var recognition = new webkitSpeechRecognition(); recognition.start(); 但是,如果我在Chrome Extension的页面上运行上面的代码,Chrome不会要求用户允许. Chrome扩展如何获得用户使用用户计算机的麦克风的权限? 谢谢. 解决方案 我认为您必须自己实施.在Chrome Extension的清单中,有一个权限参数.我认为首先,您必须获得该文件中使用麦克风的权限.我不知道该参数是什么,但是您可以在文档中检查一下. 仅在用户安装扩展名时显示此权限警告.之后,扩展可以在意志下打开/关闭麦克风.要寻求用户的许可,请首先检查网站用户正在使用的以及是否要激活麦克风.之后,只需在该网页中注入html/css代码
如何在js函数中获得SpeechRecognizer listner的响应?
我正在从事语音识别者列表中的活动. 我正在触发WebView按钮的意图(startListning(Intent))单击javascript act.startFun(); 和startfun()方法在我的mainActivity.java文件中声明 public void startFun(){ Log.d(TAG,"ONCLICK"); Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,"voice.re
0 2023-11-25
编程技术问答社区
为SRGS语法添加通用占位符
我试图将语音识别添加到我的应用中.但是不幸的是,我找不到增加通用占位符的方法.例如,我想说"我正在寻找stackoverflow",然后使用此语法: I am looking for listening to 我的问题是,如何实施" stackoverflow"的搜索.如果我使用这种语法,则识别器总是会发现"我正在寻找".太好了,但是重要的词是缺少的. 如果我不使用任何语法,那么我会得到诸如"我和寻找四个牛排溢出"之类的东西.在这里,我有一个重要的词,但不能使用规则来约束
0 2023-11-25
编程技术问答社区
使用安卓语音控制启动我的活动
我读过>这个帖子上发布的文章,我尝试了代码来启动自己的语音识别活动.有效!.因此,我的问题是,如何自定义内置语音命令按钮(硬件)的动作来启动我写的活动而不是内置语音搜索?我已经彻底搜索了网络,包括 解决方案 您必须使用SpeechRecognizer而不是RecognizerIntent.使用它有点困难,但是您可以完全控制. 有关代码,请参阅在这里:: 以及我对两种方法之间的差异的讨论在这里
0 2023-11-25
编程技术问答社区
从安卓语音注册中获取号码
我已经实现了这样的识别器意图. Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); intent.putExtra(RecognizerIntent.EXTRA_PROMPT, "Tell me stuff"); startActivityForResult(intent, REQUEST_CODE); 有这样的返回 if (requestCode == REQUEST_CODE && resultCode == RESULT_OK) { ArrayList matches = dat
0 2023-11-25
编程技术问答社区
安卓系统 语音识别
我正在尝试创建一个应用程序,该应用程序简单地检测用户可以在设备中说话的特定短语,并且该活动将根据用户所说的内容做一些事情.我很难找到有关此特定内容的教程,所以请帮助我.到目前为止,我已经创建了一个按钮,该按钮将启动识别器意图,并且我有一个on activityResult,我希望可以检测用户在说什么,然后根据用户所说的短语调用特定功能. public void OnClick_Speed_Detector(View v) { Intent i = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); i.putExtra(RecognizerIntent.EXTRA_LANGUAGE, RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); i.putExtra(RecognizerIntent.EXTRA_PROMPT, "speak up"); startAct
2 2023-11-25
编程技术问答社区
��说话人识别和分割��
寻找可以将媒体文件处理给"谁说什么和何时"的代码,换句话说是"说话者的说话者",以及每个人的时间安排.答案失败:执行任何手动工作来处理媒体文件..谢谢! 解决方案 您可以使用Kaldi的扬声器诊断,设置并不容易,但结果很棒. 还有许多其他图书馆 - lium,bob等
0 2023-11-25
编程技术问答社区
语音识别指令安卓
因此,我很广泛地搜索了有关当用户想要执行语音命令但无法找到任何解决方案的问题时删除Google语音识别UI对话框的某种解决方案.我正在尝试实现一个应用程序,该应用程序向用户显示菜单,用户可以单击选项,或者大声说出将打开新页面的选项.到目前为止,除非我使用Google识别器,否则我无法实施此功能,但我不希望对话框弹出.有人有主意吗?还是有人解决了这个问题或找到了解决方法?谢谢 编辑:作为妥协,也许有一种方法可以将对话框移至屏幕的底部,同时仍然可以查看我的菜单? 解决方案 做我很确定使用其服务的生产或商业应用程序的细微差别/龙费用.如果这只是一个演示,则可能对开发人员帐户可以很好.所有Android应用程序都是免费的. 其他解决方案 您知道可以使用Google的API进行此操作. 您可能一直在研究语音识别意图的文档.相反,请查看语音识别API的识别设备接口. 这里有一些可以帮助您的代码 public class SpeechRecognizerExam
0 2023-11-25
编程技术问答社区