首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
九寨沟
2,403 阅读
2
三款离线OCR对比(供下载)
2,371 阅读
3
台湾-景(阿里山,101,故宫,日月潭)
2,365 阅读
4
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
2,201 阅读
5
精明鼠多功能寻线王 NF-802 拆解
1,712 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
AI
园博园
甘坑
锦绣园
荔枝公园
开源
台湾
大梅沙
沙井
大沙河
博物馆
一个公园
猫
文和友
中心公园
南头古城
万景楼
华强北
懒人包
cos
傻木摄影
累计撰写
498
篇文章
累计收到
83
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
498
篇与
傻木
的结果
2025-03-08 南山博物馆,南头古城
2025年03月08日
3 阅读
0 评论
0 点赞
2025-03-08
2025-03-08 南山博物馆,南头古城 公司楼下要开个烤串店了                                             
2025-03-06
Spark-TTS,极简版音频克隆
Spark-TTS,极简版音频克隆 干啥的? 如果你是播客,经常在b站发视频解说之类的 可以录制一段你说话的录音 然后输入一段文本,生成音频,用你的音色生成一段音频 你还可以叫猪八戒给你讲故事 等等等等 使用方法非常简单 上传一段参考音频或者录制你自己的声音 输入你想转换成音频的文本 点击开始克隆即可 Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统, 它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。 该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。 Spark-TTS的核心优势在于其简洁性和效率。 它完全基于Qwen2.5构建,无需额外的生成模型,如流匹配模型等。 这一设计使得Spark-TTS能够直接从LLM预测的代码中重构音频,从而简化了流程,提高了效率,并降低了复杂性。 这种创新的方法使得Spark-TTS在语音合成领域具有显著的优势。 此外,Spark-TTS还支持零样本语音克隆(Zero-Shot Voice Cloning), 这意味着它可以复制说话者的声音,而无需为该声音提供特定的训练数据。 这一功能在跨语言和代码切换场景中尤为有用,它允许Spark-TTS在不同的语言和声音之间无缝切换,而无需为每个语言或声音分别进行训练。 Spark-TTS还支持中文和英文,这使得它能够在多种语言环境中提供高质量的语音合成服务。 同时,通过调整参数如性别、音调和语速等,Spark-TTS还可以创建虚拟说话者,为用户提供更加个性化的语音合成体验。 然而,需要注意的是,Spark-TTS主要用于学术研究、教育目的以及合法应用,如个性化语音合成、辅助技术和语言学研究等。 用户在使用时应遵守当地法律法规和道德规范,不得将Spark-TTS用于未经授权的语音克隆、冒充、欺诈、诈骗、深度伪造或任何非法活动。 jian27打包 [https://www.jian27.com/html/1459.html](https://www.jian27.com/html/1459.html) 我在jian27打包基础上进行了二次负优化 将我不需要的web界面进行了删减 删减了原包中用不上的文件,压缩包整体进行了减肥(原作 5.99gb,本站负优化后,4.11gb) 修复了一个致命bug 当文本输入框中有回车换行时,原作只会生成第一句,剩下的都舍弃了 本站所发的版本已经修复该问题,回车也不影响音频生成 另外还加了显存回收 效果的话,大概能达到原音参考音频的7成左右 某些时候转换出来的音频会语速较快 需要黄皮显卡,显存4gb以上即可 推荐6gb以上显卡  回复后,刷新可以看见下载链接 隐藏内容,请前往内页查看详情
2025年03月06日
33 阅读
0 评论
0 点赞
2025_03_02-荔枝公园,蓝忘机
2025年03月03日
17 阅读
0 评论
0 点赞
2025-03-03
2025_03_02-荔枝公园,蓝忘机             
2025_03_02-荔枝公园,树枝
2025年03月03日
16 阅读
0 评论
0 点赞
2025-03-03
2025_03_02-荔枝公园,树枝              
2025-03-01 华侨城创意文化园
2025年03月01日
12 阅读
0 评论
0 点赞
2025-03-01
2025-03-01 华侨城创意文化园 来回逛了两次 所以有些场景是重复的,图片是按照时间线上传的 都非常喜欢 所以这个帖子图片非常多                                                   
2025,02,25,流水账
2025年02月25日
25 阅读
0 评论
0 点赞
2025-02-25
2025,02,25,流水账 今天去工厂了 特么办公室一没有素质手机滴滴滴响个不停 真特么没素质 根本不知道公众场合文明礼仪是何物 不是不能搞他 我是网管 有很多办法搞他 不搞他,一是碍于其他人面子 一是我知道这不道德 无奈,只能去避避 楼顶天台 刚搬过来那会是开放的 在后面一段时间锁起来的 锁了相当一段时间 今天发现门是开着的 原本也应该开着的 毕竟天台是重要的消防通道 法律规定必须开放 就上去看看 结果全都遮起来了 全部安装了太阳能板 有个楼梯,就爬上去看了看 看样子装的时间不长 角度太平,导致雨水加灰尘沉积在凹陷处 这也是没办法 毕竟广东台风多 装得太陡峭的话,台风天容易吹翻    这是好多年前拆解的索尼卡片机  下班回来跟老板去看了会场 环境很不错            
2025-02-25
FunASR-webui,音频转成文本
FunASR-webui 用于将音频转成文本 例如会议录音转成文字记录 mp4视频文件转换成字幕文件等等 运行界面如下 加载音频或者MP4文件 点击开始按钮 耗时视音频长度而不一 效率还是很高的 转换完成会在out目录自动保存为三个格式 一个txt,一个视频字幕文件,一个音频歌词格式文件 消耗显存约2.5gb左右 转载于 B站十字鱼 [https://www.bilibili.com/video/BV193AfenEiv/?spm_id_from=333.1387.homepage.video_card.click](https://www.bilibili.com/video/BV193AfenEiv/?spm_id_from=333.1387.homepage.video_card.click) 作者的开源页面 [https://github.com/gluttony-10/FunASR-webui](https://github.com/gluttony-10/FunASR-webui) 本站独家负优化 显著减少体积,压缩包3.2gb(原作5.4gb) web界面简化  百度网盘下载链接,回复后刷新可见 隐藏内容,请前往内页查看详情
2025年02月25日
67 阅读
1 评论
0 点赞
1
2
...
72
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net