潘帆 作品数:46 被引量:69 H指数:5 供职机构: 四川大学电子信息学院 更多>> 发文基金: 四川省科技支撑计划 国家自然科学基金 四川省科技计划项目 更多>> 相关领域: 电子电信 医药卫生 自动化与计算机技术 生物学 更多>>
一种实现耳鸣匹配声源多样化的新方法 被引量:5 2011年 在耳鸣掩蔽治疗领域中,由于患者对同一种耳鸣匹配声源的感受千差万别,因此其多样性是影响治疗效果的决定性因素。但国内外传统的治疗仪普遍存在耳鸣匹配声源不足的缺陷。针对这个问题,本文受语音转换系统的启发,提出了一种基于双线性变换函数的方法来对特定的匹配声源进行频谱搬移以达到声源多样化的目的。同时,由于双线性变换函数只能有效改变声源共振峰的频率以及带宽而不能对其幅度进行控制,这样的特性最终会导致其能量的衰减。那么文中提出利用临界倾斜滤波器来补偿频谱搬移所引起的能量损失,并给出了一种搜寻最佳倾斜系数的方法及其微调范围。通过仿真表明,这种方法取得了良好的效果,丰富了耳鸣匹配声源的多样性,具有一定的实用参考价值。 熊培杰 何培宇 潘帆关键词:频谱搬移 基于多特征融合网络的心音分割方法研究 2024年 目的 提出一种基于多特征融合网络的心音分割方法。方法 研究资料来源于2016 CinC/PhysioNet数据集(来自764例患者的3 153段记录,男性约占91.93%,平均年龄30.36岁)。首先从时域与时频域中分别对心音进行特征提取,再通过特征降维的方法减少输入的冗余特征;然后经过特征选择分别找到两个特征空间中性能最佳的特征;利用多尺度空洞卷积、协同融合和通道注意力机制实现多特征融合;最后,将得到的融合特征送入双向门控循环网络(BiGRU)实现心音分割。结果 本方法在测试集上得到的心音分割精确率、召回率与F1值分别能达到96.70%、96.99%与96.84%。结论 本文提出的多特征融合网络具有较好的心音分割性能,能够为设计以心音为基础的心脏疾病自动分析提供高准确率的心音分割技术支持。 田翩 何培宇 蔡杰 赵启军 李莉 钱永军 潘帆关键词:主成分分析 多特征融合 基于束搜索法的基音标注新方法 2011年 基音标注在语音合成等方面起着重要作用。目前使用比较广泛的动态规划基音标注算法,约束准则大都比较简单,采用的动态规划算法往往偏重于局部最优,而非全局最优。基于此,提出了一种基于束搜索法的基音标注新方法。除周期与幅度外,引入了图形与位置作为约束准则,更严格地筛选基音标注候选点,并采用束搜索的方式,从全局最优出发,兼顾局部最优,进行基音标注。此外,为了提高基音估计准确度,获得更精准的基音标注,还提出了一种基于束搜索法的基音轨迹提取方法,从多种不同的基音检测算法结果中提取基音轨迹。仿真结果表明,与传统的动态规划基音标注算法相比,基于束搜索法的基音标注新方法具有更高的准确率。仿真中,新方法的平均准确率为98.57%,而传统方法的平均准确率为94.70%。 孟晔 何培宇 潘帆实时高精度麦克风阵列数据采集系统 被引量:3 2013年 针对麦克风阵列语音增强系统对高精度和强实时性数据采集的需要,设计并实现了一种基于FPGA的麦克风阵列数据采集系统。其主要包括数模转换模块、数据接收处理模块和以太网控制模块3部分,实现了对16路语音信号的高质量采样和传输。系统中,将UDP数据报协议用硬件编程语言verilog在FPGA上实现,与基于操作系统的TCP/IP协议族实现UDP协议相比,大大提高了资源利用率。测试结果表明,系统能完成16路语音信号的高精度、高可靠性实时采集和传输,以太网传输速率达2.3MByte/s,满足了麦克风阵列语音增强系统的研究需要。 胡德孟 何培宇 张勇 潘帆 罗胡琴关键词:麦克风阵列 FPGA UDP协议 数据采集 基于时频图表示的多轨个性化耳鸣康复音生成方法 2024年 针对传统耳鸣声治疗方法在患者掩蔽频段的对应效果不精确或掩蔽效果不佳的问题,本研究基于时频图表示(time-frequency representations,TFR)方法,提出了一种多轨个性化耳鸣康复音(multi-track personalized tinnitus rehabilitation sound,MT-PTRS)的生成方法。该方法不仅能体现耳鸣掩蔽疗法所需的频率集中特性,且一定程度上提高了耳鸣康复音的可听性。本研究基于基本的自然声库,通过TFR方法识别出自然声中的主要能量频段,并结合患者耳鸣频段对自然声进行切割、分类,进一步合成频率集中的个性化自然掩蔽声。本研究将个性化自然掩蔽声作为主要音轨,结合宽带自然声生成MT-PTRS,相较传统掩蔽治疗中的窄带噪声,具有更好的可听性和自然性。实验结果表明,相较于其他的多轨耳鸣康复音方法,该方法生成的康复音的悦耳度和丰富度有一定提升,增加了患者对声治疗的耐受性,对耳鸣声治疗研究具有一定参考价值。 谢子奇 何培宇 陈娅南 李永康 方安成 潘帆关键词:声音合成 自然音 基于调频调幅的耳鸣匹配声源合成及多样化 被引量:2 2013年 耳鸣掩蔽疗法是临床治疗耳鸣的常用方法.国内外传统的耳鸣治疗仪普遍存在耳鸣匹配声源不足且匹配效果差的缺陷.针对该问题,本文基于调频调幅语音模型,结合能量分离算法,提出一种分离合成及多样化最常见的耳鸣声源——蝉鸣声的方法.实验表明,该方法取得了较好的效果,丰富了蝉鸣声匹配声源,且计算复杂度低;能够拓展到实现其他耳鸣匹配声源的合成及其多样化,具有一定的医用参考价值. 王海燕 何培宇 潘帆 王杨靖 崔焘结构先验指导的文本图像修复模型 2023年 目的图像修复是根据图像中已知内容来自动恢复丢失内容的过程。目前基于深度学习的图像修复模型在自然图像和人脸图像修复上取得了一定效果,但是鲜有对文本图像修复的研究,其中保证结构连贯和纹理一致的方法也没有关注文字本身的修复。针对这一问题,提出了一种结构先验指导的文本图像修复模型。方法首先以Transformer为基础,构建一个结构先验重建网络,捕捉全局依赖关系重建文本骨架和边缘结构先验图像,然后提出一种新的静态到动态残差模块(static-to-dynamic residual block,StDRB),将静态特征转换到动态文本图像序列特征,并将其融合到编码器—解码器结构的修复网络中,在结构先验指导和梯度先验损失等联合损失的监督下,使修复后的文本笔划连贯,内容真实自然,达到有利于下游文本检测和识别任务的目的。结果实验在藏文和英文两种语言的合成数据集上,与4种图像修复模型进行了比较。结果表明,本文模型在主观视觉感受上达到了较好的效果,在藏文和英文数据集上的峰值信噪比和结构相似度分别达到了42.31 dB,98.10%和39.23 dB,98.55%,使用Tesser⁃act OCR(optical character recognition)识别修复后藏文图像中的文字的准确率达到了62.83%,使用Tesseract OCR、CRNN(convolutional recurrent neural network)以及ASTER(attentional scene text recognizer)识别修复后英文图像中的文字的准确率分别达到了85.13%,86.04%和76.71%,均优于对比模型。结论本文提出的文本图像修复模型借鉴了图像修复方法的思想,利用文本图像中文字本身的特性,取得了更加准确的文本图像修复结果。 刘雨轩 赵启军 潘帆 潘帆 普布旦增关键词:图像修复 基于二阶和高阶统计量的语音信号盲分离算法研究 被引量:3 2007年 研究了两种基于高阶统计量的盲信号分离算法,在各种不同的实验条件下比较了两种算法与基于二阶统计量的盲信号分离算法的分离性能,分析比较了3种算法的计算复杂度,为工程应用和DSP(数字信号处理器)实现提供了参考,最后总结了两大类算法的优缺点,并分析了原因. 吴景田 何培宇 潘帆关键词:盲信号分离 高阶统计量 二阶统计量 计算复杂度 一种基于超混沌的个性化耳鸣康复音合成方法 被引量:2 2018年 耳鸣主要表现为非外部声音产生的听觉感知。因其发病率较高、严重影响人的正常生活而越来越受到关注。研究表明,相似而不重复的音乐可作为耳鸣康复音来缓解耳鸣症状。但现有的合成音乐存在无法与试听者个性化匹配和试听效果较差等问题。针对这些问题,基于超混沌算法与主旋律提取,提出一种个性化合成耳鸣康复音的新方法。结果表明,此方法合成的康复音在保证整体相似不重复的前提下,试听效果更舒缓自然,且在耳鸣模型中对耳鸣有一定抑制作用,对耳鸣的治疗具有一定的参考价值。 金宁敏 何培宇 潘帆 陈杰梅关键词:信号与信息处理 语音合成 个性化 超混沌 持续集成系统可视化设计研究 被引量:9 2020年 持续集成/持续交付是敏捷软件开发的核心实践,而持续集成/持续交付的有效实施要求团队在信息高效共享情况下的有效协作。高效的协作在中型或大型组织中始终是一个挑战,而将持续集成/持续交付过程可视化,可以大大提升信息共享的效率和效果。文中完整提出了可视化的体系设计和参考架构,该设计将各种信息进行有序合理的组织,以最有效的方式呈现或推送给相关人员,连接并牵引相关人员采取及时的行动以提升产品交付的效率和质量。同时还陈述了可视化设计背后的思考和决策因素,使该可视化设计在不同情况下可进行适当的定制,以适应不同的应用场景。该方法已在大中型的软件组织中成功落地实践。提出的设计和架构,具有实际的工程应用参考价值。 张晓帆 刘宁 潘帆关键词:可视化 敏捷