FritzHugo3 wrote: ↑Sat, 28. Oct 23, 04:35
Ist das nun eine Vermutung von dir, dass das eine KI spricht oder weißt du es? Eine Quelle wäre toll.
Die Leseprobe habe ich von einer KI sprechen lassen. Die KI "versteht" in gewissem Umfang, welche Emotionen der Text vermittelt, und spricht daher extrem realistisch. Der "gewisse Umfang" bezieht sich auf den Abschnitt Text, den die KI jeweils am Stück spricht, also i.d.R. ein Absatz aus drei, vier, fünf Sätzen. Sehr viel mehr als einen Absatz kann man die KI derzeit nicht am Stück sprechen lassen, weil sie sonst "abdriftet", also anfängt, zu kichern, zu gurgeln, zu schreien, Wörter hinzuzufügen, die nicht im Text stehen, in unbekannten Sprachen zu sprechen, oder sonstige komische Geräusche zu machen. Happy Halloween, Freunde, der Geist in der Maschine lässt schön grüßen
Für die Zitate habe ich die Stimme von Karl Heinz Tafel verwendet, der sie auch im Hörbuch von Farnhams Legende gesprochen hat. Ich habe die KI mit 30 Minuten seiner Stimme aus FL trainiert, danach kannte die KI alle seiner sprachlichen Manierismen. Karl Heinz Tafel ist allerdings 2012 verstorben; zu diesem Zeitpunkt war ein derart lebensechtes Voice Cloning nicht absehbar. Für das fertige Produkt werde ich seine Stimme trotzdem nicht verwenden, sondern eine rechtliche einwandfrei lizenzierte. Die anderen Stimmen in der Leseprobe sind bereits lizenziert und kommerziell verwendbare Stimmen. Ich finde, sie hören sich sehr gut an.
Leider ist es mit "Text in KI reinwerfen und Hörbuch fällt fertig raus" (noch) nicht getan. So gut die KI auch ist, sie macht im Moment noch eine Menge Fehler, die ich im Nachgang neu einzeln generieren muss. Pro Kapitel fallen 40-50 Nachbearbeitungen an. Manchmal kennt sie deutsche Wörter nicht (sie hat z.B. extreme Schwierigkeiten, das Wort "ihn" auszusprechen, sie tendiert dazu, statt dessen den englischen Namen "Ian" zu sagen.) Sie hat auch Probleme mit den meisten Alien-Namen. Zudem muss die Stimme professionell aufbereitet werden, also mit dynamischem Kompressor, EQ und Limiter versehen werden, sodass sie Hörbuchstandards entspricht. Die KI spricht manchmal relativ leise und manchmal relativ laut, je nach "Laune", das ist ist im Vorfeld nicht exakt kontrollierbar, daher muss das im Nachhinein angeglichen werden.
Nach dem technischen Geplänkel jetzt die wichtigen Fragen:
Wieso KI und nicht lebendige Sprecher? Die Antwort bleibt dieselbe, die ich seit Jahren gegeben habe: Echte Sprecher inkl. Studiozeit kann ich weder bezahlen noch habe ich Zeit, das zu managen. Wenn jemand anders Zeit und Geld hat, nur zu. Ich glaube, das sagte ich bereits vor Jahren, aber Freiwillige haben sich nie gemeldet
Wie viel Zeit benötige ich für ein Hörbuch? Ich rechne derzeit mit etwa 80-120 Stunden pro Hörbuch, das kann sich aber noch ändern. Ich arbeite gerade am ersten "echten" Kapitel und entdecke dabei weitere Hürden. Auf der anderen Seite wird sich mein Arbeitsablauf mit wachsender Erfahrung sicher beschleunigen. Auf einer noch anderen Seite habe ich aber auch weitere Interessen, wie Space Metal produzieren, die ich nicht für zwei Jahre unterbrechen werde, um fünf Hörbücher zu machen, die von zwanzig Leuten gehört werden
Wie teuer ist das ganze? Leider ist die KI, die ich verwende, nicht kostenlos. Ich habe mit lokal installierten, kostenlosen Voice-KIs experimentiert, aber sie kommen (derzeit) nicht einmal in die Nähe des kommerziellen KI-Dienstes, den ich verwende. Die Produktion eines Hörbuchs wird ca. 300-400 Euro kosten (meine Arbeitszeit nicht einberechnet), als unteres Limit, wenn alles einigermaßen gut läuft. Schlimmstenfalls könnte es sich aber auch verdoppeln. Hinzu kommen ggf. noch Lizenzen für Ambiences/Geräusche; das kann ich derzeit noch nicht abschätzen. Rechnen wir mal mit durchschnittlichen 500€/Hörbuch, alles (außer meiner Arbeitszeit) eingeschlossen, also KI und Lizenzen. Das kann ich vorfinanzieren, aber es wäre natürlich schön, wenn ich am Ende nicht auf den Kosten sitzen bleibe. Mit NOPILEOS werde ich einen Feldversuch starten, komme ich da kostenneutral raus, denke ich über die anderen Hörbücher nach.
So, ich hoffe, dass das viele Fragen beantwortet. Schönes Wochenende, und wir hören uns auf der anderen Seite.
Helge