为盲人父母设计文字转语音


12

我的第一篇文章在这里。(我衷心希望这属于我不知道该去哪里的允许的帖子之内)。

我计划为一个90岁的母亲做一个项目,她的视力迅速丧失,过着相对轻松的生活。

她独自一人坐在家里看基本电缆,没有互联网连接。她有一个带有60个小按钮的巨大遥控器,基本上对整个事情感到困惑。

我只想在硬盘上放一个电影和/或有声读物库,以便她可以浏览它们并在闲暇时观看。

我决定她需要一个带有6个大可配置按钮的简单操纵杆。我需要找出某种方式来自动读取标题(在选择之前,她会向下滚动)。

在监视器上提供巨大文本的GUI可能就足够了...但是我相信文本到语音转换功能可能是最困难的问题。

如果把标题读给她听,GUI几乎是一个争论点。

我看到XBMC具有一些文字转语音功能...尽管我无法确定是否需要她的视线才能通过界面导航才能“进入”内容。(此外,我无法确定gui是否读取了菜单本身-允许“看不见的”导航)

我需要一个GUI在启动时立即打开一个列表(通过该GUI,她可以简单地滚动并选择内容)。

我的简单问题是,使用PI是否有可能,看来这是否可以实现。

偶尔有人会指出我正确的方向,对此我将无尽的感激。

非常感谢。


您是否尝试过在该论坛上搜索“语音”。有几个链接(我还没有真正尝试任何)如raspberrypi.stackexchange.com/questions/1015/...
Milliways

我不确定您是否已在Rapsberry组织论坛上发布了此内容。如果您还没有这样做的话,那便是经常被问到的那种问题。
2015年

尽管有一个用于“语音识别”的标签,但是对于“语音生成”却没有相反的含义,“语音生成”本身就是一个离散的主题。它是通常被称为“文本到语音”(第二部分)的一部分,并且所有这些都通常与通常称为“可访问性”的事物相关,这些事物使事情变得更易于使用。完全有能力的人,以及有一定程度障碍的人,可能需要其他功能才能获得相同的结果。此答案已用于创建这三个标签。
SlySven 2015年

3
我非常喜欢这个项目的想法,我刚刚在Raspberry Pi Meta的圣诞节赠品竞赛中提名它为“ 最佳原创Raspberry Pi项目想法”
Phil B.

1
对于所有发布者:对此的响应使我感到非常振奋和鼓舞。我是新手,从未亲眼见过PI。我非常感谢您的亲切回应,并因为这些回应,再次表达了追求这一点的决心。我还和妈妈分享了这个消息-妈妈说她更喜欢苹果而不是覆盆子派,但我真的不知道我在说什么...但是现在就可以了:)。
LeoFib

Answers:


8

我不确定如何制作gui,但是我知道如何进行文字转语音。您可以使用espeak:

sudo apt-get install espeak
espeak 'Hello world'

默认情况下,(对我而言)espeak的声音难以理解。要找到声音,请使用:

sudo apt-cache search espeak

然后,找到声音。安装它。然后跑

man espeak

找到如何改变声音。应该很简单。

这是我使用espeak制作的示例:https : //github.com/Merlin04/robotthingy

编辑:我认为您可以使用Kivy制作GUI。它使用python。


7

我在XBMC方面的经验有限,但我坚信对于“目标受众”(这位90岁的女性)来说,这可能已经太复杂了。

但是,我相信这个项目绝对可以在RasPi上实现。由于我是一名Web开发人员,因此建议您构建一个简单的Webapp。我不知道是否存在类似的东西,但是我无法想象它很难开发。

基本思路:

  1. RasPi与Raspbian。
  2. Webapp正在运行apache。
  3. 一些后端(例如PHP)对硬盘上的文件建立索引,将名称格式化为某种可读格式,然后将它们输出为列表。
  4. 使用javascript控制操纵杆输入,并使用HTML5语音合成API(例如:http//creative-punch.net/2014/10/intro-html5-speech-synthesis-api)读取电影/书籍的标题/)。
  5. 选择电影/书后,只需在浏览器中打开文件。(这样一来,您不必打开新窗口,只需按下后退按钮即可返回菜单。)

OSMC(kodi)公开了一些其他的api。也许您可以使用它来构建自己的前端/ GUI。但是,我同意Rien的观点,这对您的听众来说过于复杂。我不认为有人可以帮助她启动/停止有声读物吗?
哈夫纳

嗨,Havnar,不,实际上。她的房子里有两只狗,仅此而已...我认为,我忽略提到的一件事是她也没有互联网连接。
LeoFib 2015年

好几个问题。为了简洁起见,我会尽量简短。1)RasPi 2,对吗?2)您会为此推荐什么操作系统?3)您认为没有WIFI即可实现吗?--She,她没有网络连接。4)Apache用于运行服务器还是OS?5)我是否应该开始熟悉linux及其命令以进行自我准备?这是一个主意:youtube.com/watch ? v=NCVWX4suGE4您如何看待?我应该只使用通用RPI 2套件吗?-非常感谢,新年快乐。
LeoFib

1
1)pi2的功能强大得多,无论您采用哪种方式,它都会使您受益。2)raspbian是最人性化和最常用的一种,因此很容易找到指南和帮助。3)您可以在没有互联网连接的情况下使用wifi,如果您使用红外遥控器,则不需要无线设置4)您可以使用许多Web服务器都被广泛使用。5)是的,仍然是一个有用的技能!5B)您可以从带有sdcard的pi2,hdmi电缆,电源适配器开始,然后开始使用它。当然,某些应用程序开发技能很方便。
哈夫纳

1
我对事物的看法与Havnar不同,所以我在这里回答:1)没必要,我认为1B也应该足够强大,但是2还是安全的。2)Raspbian的确如此,因此众所周知,它最受支持3/4 )Apache是​​网络服务器软件,因此您可以在系统(本例中为raspi)上运行自己的网站。这意味着您根本不需要Internet连接,因为该网页将在您的RasPi上运行。5)是的,我认为一些基本的命令行对于使raspbian和apache运行非常有用。
Rien Heuver,2015年

4

我已经为您做了一些轻松的挖掘,因为对于您的目标受众而言,大多数事情都可能变得非常复杂。

从我的个人经验来看,按钮和图形用户界面(无论在开发人员眼中多么简单)都会给老年人带来困惑。

我不知道您在(网络)开发中的技能水平如何,或者您是否可以激发熟练的开发人员来帮助您实现目标,但是对于最终用户而言,简化是关键。

您可能正在寻找“一键有声读物播放器”。也许是对它的改编。

摘录如下:

It basically consists of:

1 Raspberry Pi
1 ModMyPi enclosure
1 button
2 resistors (330 Ohm, 10 Kilo-Ohm)
1 blue LED
1 (slow) 8GB SD-Card
some wire
a pair of speakers

使用了以下软件:

Raspbian minimal image (http://www.linuxsystems.it/2012/06/raspbian-wheezy-armhf-raspberry-pi-minimal-image)
mpd (music player daemon)
mpc
mpd-python
pyudev (for USB access)
a self-written python script

功能如下:

  • 始终打开:打开树莓派电源时,它将启动并在暂停有声读物的情况下启动python脚本

  • 一键使用:当您按下按钮超过4秒钟时,该按钮会暂停和取消暂停有声读物或返回一首曲目

  • 记住位置:它将始终记住上次播放的位置

  • 只有一本有声读物:Raspberry上永远只有一本有声读物

  • 轻松进行有声读物的部署:当插入带有特殊名称/标签的USB拇指驱动器时,Raspberry将停止播放,安装拇指驱动器,删除旧的有声读物,复制新的有声读物,重建播放列表,以及–拔下拇指驱动器–在暂停模式下启动新的有声读物

  • 多种格式:由于使用mpd,播放器支持Ogg Vorbis,FLAC,OggFLAC,MP2,MP3,MP4 / AAC,MOD,Musepack和wave

>>>来源<<< ---所有功劳归于此!

github链接


如果认真操作为目标受众呈现一致且简单的UI,则使用操纵杆可能可以扩展控制界面-链接站点上的一位评论员指出,只有在RPi通电时它才记住播放位置-可能需要修改-尽管我敢肯定,当我对LAN音乐服务器进行一些实验时,mpd记住它在长播放列表中的位置,也许有一个选择...
SlySven

没有理由不让pi保持供电,无论如何,它对Pi的sd卡来说更好,它的构建不被关闭。
哈夫纳

它不会关闭。 ”也许最好说,“它不能容忍在没有正确关闭的情况下关闭电源。” -我使用的Pi的UPS可以按2-1000分钟开启和2-1000分钟关闭之间的任何时间周期启动和关闭Pi,这将在延时摄影中得到应用-并且没有迹象表明这从本质上讲是有害的-尽管我同意SD卡可能会由于这些额外的日志文件写入而“磨损”得更快一些。
SlySven 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.