1

yop,

Est-ce qu'il existe des softs qui créent des messages audio à partir d'une phrase qu'on dit, dans une langue donnée ? L'idée, ça serait de créer plusieurs messages simples, en anglais de préférence, mais sans avoir à faire la capture audio de ma propre voix.
Le soft devrait être le plus simple possible, donc pas quelque chose dans le genre du photoshop de l'audio.
Je voudrais une sortie mp3 ou wav, en tout cas quelque chose de léger, qui ne fasse pas plus de quelques ko pour des messages de 3 secondes en moyenne. Evidemment, la qualité audiophilistique n'est surtout pas de rigueur. cheeky

Merci d'avance.

2

Tu ne peux pas utiliser le narrateur Windows pour ça ? trivil
C'est un peu rudimentaire, mais si tu tapes du texte dans le bloc notes, ça devrait lire ce que tu as écrit. Par contre pour l'enregistrement, je pense qu'il faut des drivers spéciaux pour ta carte son (l'enregistrement de "Stéréo Mix" ayant été désactivé dans les drivers fournis avec Windows 8 sad)
avatar
Le scénario de notre univers a été rédigée par un bataillon de singes savants. Tout s'explique enfin.
T'as un problème ? Tu veux un bonbon ?
[CrystalMPQ] C# MPQ Library/Tools - [CrystalBoy] C# GB Emulator - [Monoxide] C# OSX library - M68k Opcodes

3

4

Pen^2 je t'aime love j'ai absolument pas besoin de plus compliqué grin

Golden -> Ah ça existe dans Windows, directement, je savais même pas grin Je vais quand même aller voir pour ma culture.
Par contre, quand tu parles d'enregistrement par la carte son, tu parles de capture audio par un micro, c'est ça ? C'est de toute façon ce que je désire absolument éviter. smile

5

hehe (par contre ça a l'air limité à 100 caractères, j'espère que ce sera suffisant)
Folco (./4) :
Ah ça existe dans Windows, directement, je savais même pas grin.gif?117
Oué, c'est pour permettre aux sourds de lire cheeky
Il n'y a(vait) qu'une voix par défaut (Sam je crois ?)

6

./4 > Non, je parle de la capture de la sortie audio (en gros la capture du signal de sortie interne de la carte son), sans passer par un micro smile
avatar
Le scénario de notre univers a été rédigée par un bataillon de singes savants. Tout s'explique enfin.
T'as un problème ? Tu veux un bonbon ?
[CrystalMPQ] C# MPQ Library/Tools - [CrystalBoy] C# GB Emulator - [Monoxide] C# OSX library - M68k Opcodes

7

Oh ben mes messages dépassent pas les 20 caractères, donc ça ira cheeky

8

On trouve des drivers audio "virtuels" qui permettent d'enregistrer tout les sons joués.

Côté synthèse vocale, tu as ça qui est pas mal du tout pour le français (d'ailleurs, je crois que c'est eux qui ont fait les voix des annonces du tram lillois hehe), et ils proposent d'autres langues aussi. Par contre si ton appli va être publique, je doute que la licence permette d'utiliser leur générateur de démo ^^

Il y a une solution open-source (Espeak + MBROLA), mais de qualité nettement moins bonne : http://doc.ubuntu-fr.org/synthese_vocale

Côté stockage, si tu veux gagner de la place :
- si la qualité n'a pas trop d'importance et que tu cherches la simplicité, tu peux réduire la fréquence d'échantillonnage (32 kHz c'est quasi-transparent, 16 kHz c'est correct, 8 kHz c'est "qualité téléphone"), et également utiliser une compression A-law ou µ-Law. Si tu encapsules ça dans un fichier WAV, Windows pourra le lire directement. Sous Linux je sais pas si c'est possible, mais la décompression est une simple look-up table donc ça se fait très facilement en quelques lignes de code.
- si tu veux de la qualité sans te prendre de la tête, tu peux faire du MP3 encapsulé dans du WAV. Windows le supporte sans rien avoir à faire. Par contre ce n'est pas multiplateforme.
- si tu veux de la qualité et du multiplateforme, une solution est Opus, mais c'est plus lourd à gérer.

Pour ce qui est des softs, tu peux convertir éditer et convertir tes fichiers sons avec Audacity (avec une GUI), et avec Sox (utilitaire en ligne de commande) si tu veux traiter plein de fichiers d'un coup. Pour la compression MP3, tu as Lame. Tout ça est open-source.

EDIT : ah, et la synthèse vocale de Windows... j'ai pas testé celle de Windows 7, mais celle de XP était médiocre, et moins bonne que celle de MacOS 7 qui est pourtant sorti bien avant.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

9

Un grand merci pour tout. smile

Ce que je veux faire, c'est tout simplement jouer le son d'une voix qui va dire quelques chose comme "larva", "minimap", "creep" ou que sais-je encore, tous les x secondes. C'est toujours dans le cadre de mon métronome sur SC2. Donc la qualité, osef, Windows-only sera parfait, et il est surtout pas question que je me prenne la tete avec des choses techniques dont je ne maitrise pas du tout le début du commencement.
Merci d'avoir fait ce point.

Ah, le truc qui m'intéresse le plus, c'est quand tu parles de mp3 encapsulé dans du wav, ça signifie quoi ? je croyais que les deux étaient des formats, alors que veut dire "encapsulé" ? concrèrement, c'est encodé comment dans le fichier .wav ?

10

Le WAV c'est un conteneur, ça contient presque toujours du PCM, mais ça peut contenir d'autres formats… Dont du MP3 smile

Un peu de "doc wikipédia": https://fr.wikipedia.org/wiki/WAVEform_audio_format smile
avatar
Le scénario de notre univers a été rédigée par un bataillon de singes savants. Tout s'explique enfin.
T'as un problème ? Tu veux un bonbon ?
[CrystalMPQ] C# MPQ Library/Tools - [CrystalBoy] C# GB Emulator - [Monoxide] C# OSX library - M68k Opcodes

11

Le WAV n'est qu'un conteneur (comme l'AVI pour les vidéos). Le plus souvent il contient de l'audio non compressée, d'où l'abus de langage qui fait qu'on parle souvent du WAV comme un format audio non compressé, mais rien n'oblige à ce que ce soit le cas. Tu peux par exemple mettre un son au format MP3 dedans.

Concrètement, dans le fichier c'est un ensemble de blocs imbriqués, chacun contenant une entête avec le type de bloc et sa taille en octets. Dans un fichier WAV qui contient du MP3, tu vas avoir un bloc WAVE, qui contient deux sous-blocs ; le premier contient des informations sur le format des données ("c'est du MP3", "la fréquence d'échantillonnage c'est autant", etc.), et l'autre bloc contiendra les données proprement dite, qui sont exactement les mêmes que dans un fichier .MP3. Tu as plein d'autres blocs optionnels pour rajouter des métadonnées (nom de l'auteur, icône, position des points de boucle pour les samples, etc.).

Le format AVI pour les vidéos est très semblable.

EDIT : zut, grillé par GC tongue
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

12

Zerosquare (./8) :
Il y a une solution open-source (Espeak + MBROLA), mais de qualité nettement moins bonne : http://doc.ubuntu-fr.org/synthese_vocale

Il y a aussi Espeak tout court, sans MBROLA (qui est non-libre et compliqué à installer):
sudo dnf install espeak
espeak -v en-us -w hithere.wav 'Hi there Folco!'
espeak -v fr -w exemplefr.wav "Est-ce qu'il existe des softs qui créent des messages audio à partir d'une phrase qu'on dit, dans une langue donnée ?"

100% GPL et marche sans rien configurer.

Et si tu veux absolument travailler sous un système d'exploitation pourri, il y a aussi un EXE sur http://espeak.sourceforge.net/download.html.
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

13

Merci à tous pour vos explications très claires ! top

@Kevin -> c'est le système cible, après les sons je peux les enregistrer sous linux ou win, aucune importance.
En tout cas je savais pas qu'il y avait autant de softs qui savent lire du texte, j'avais jamais utilisé un truc comme ça, et ça marche plutôt bien ^^

14

La synthèse vocale d'OS X est pas mal également, si celle de Windows n'est pas terrible, et si j'arrive à enregistrer le résultat, je peux te faire les enregistrements.
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

15

Merci beaucoup ! J'en suis à coder mon programme, j'ai des sons de base faits grâce à la page de Pen^2 (comme ça j'ai un son en deux clics), il sera toujours temps d'y revenir à la fin. Merci encore. smile

16

Mmmmhh, je ne trouve pas où Windows sait faire ça ? Et sur google, "windows synthèse vocale" et assimilé renvoie la manière de faire parler windows, pas celle de lui faire lire des textes.
Aspeak (et son front-end aspeakedit) est fait pour des ingénieurs du son dès qu'on veut autre chose que la voix par défaut, à la vitesse par défaut, et la tonalité par défaut.
Sinon, le site de Pen^2 m'ira bien. Acapela group, c'est pas mal aussi, mais pour quelques mots que j'ai à faire dire, c'est pas idéal.

Merci bien pour tous vos conseils en tout cas. smile

17

Pen^2 (./5) :
Il n'y a(vait) qu'une voix par défaut (Sam je crois ?)
https://www.youtube.com/watch?v=lq-1HtSr5nM
cheeky
(mais c'est un peu moisi grin)

18

Ah oui, c'est bien planqué sous Windows 7...
Tape "reconnaissance vocale" dans le menu démarrer, puis clique sur "Synthèse vocale" dans le panneau de gauche (super logique hein ? triso)

Pen² > pas besoin de rajouter quoi que ce soit, Windows 7 a une voix préinstallée qui est meilleure que celle là (qui était celle de XP).
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

19

Ok, merci happy
Bon, ben en fait, ya pas de champ rechercher dans mon menu, j'ai cherché 1/4 d'heure sans trouver, et impossible de mettre la main sur ce truc sick
Peut-être directement avec le nom du binaire, svp ?

20

Panneau de configuration > Reconnaissance vocale > Synthèse vocale smile

(choisis Afficher par : Grandes icônes si tu ne vois pas l'icône Reconnaissance vocale)
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

21

Ok, merci bien, essayé. Ben le grand gagnant de la soirée, c'est quand même le site de Pen2, ya pas photo grin

22

#alandon# (Pas de champ rechercher dans ton menu win7 ?! Comment tu fais ?)

23

Je sais pas grin

24

Ah, je pensais que t'avais utilisé un patch quelconque pour le virer, et je me demandais pourquoi (vu que c'est plutôt pratique).

la feature s'est peut-être brisée en tombant du camion ? cheeky
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

25

Folco (./16) :
Aspeak (et son front-end aspeakedit) est fait pour des ingénieurs du son dès qu'on veut autre chose que la voix par défaut, à la vitesse par défaut, et la tonalité par défaut.
Espeak, tu veux dire? Il y a des options en ligne de commande pour tout ce que tu mentionnes:
  • voix: Tu as ces variantes (cf. espeak --voices=variant
    ):Pty Language Age/Gender VoiceName          File          Other Languages
     5  variant        F  female2              !v/f2         
     5  variant        F  female3              !v/f3         
     5  variant        F  female4              !v/f4         
     5  variant        F  female5              !v/f5         
     5  variant        F  female_whisper       !v/whisperf   
     5  variant        -  klatt                !v/klatt      
     5  variant        -  klatt2               !v/klatt2     
     5  variant        -  klatt3               !v/klatt3     
     5  variant        -  klatt4               !v/klatt4     
     5  variant        M  male2                !v/m2         
     5  variant        M  male3                !v/m3         
     5  variant        M  male4                !v/m4         
     5  variant        M  male5                !v/m5         
     5  variant        M  male6                !v/m6         
     5  variant        M  male7                !v/m7         
     5  variant        M  whisper              !v/whisper    
     5  variant      70F  female1              !v/f1         
     5  variant      70M  croak                !v/croak      
     5  variant      70M  male1                !v/m1       
    À choisir par exemple avec -v fr+f1.
  • t is 175
    vitesse:-s <integer>
               Speed in words per minute, 80 to 450, defaul
  • ult is 50
    tonalité:-p <integer>
               Pitch adjustment, 0 to 99, defa
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

26

voilà, ça devait être configurable dans je ne sais plus quel utilitaire custom grin