Głos wydaje się być jedną unikalnych cech, które rozróżniają każdego człowieka. Barwa i wysokość głosu jest często znakiem rozpoznawczym lub nawet narzędziem pracy. Już nie. Eleven Labs to polski startup z branży sztucznej inteligencji, który wyróżnia się swoją oryginalnością.
W Eleven Labs możesz stworzyć naturalnie brzmiące ścieżki audio i wybierać spośród dziesiątek lektorów AI, którzy brzmią… przerażająco realistycznie. Witaj w przyszłości, w której głos wcale nie definiuje człowieka, ponieważ może należeć do maszyny.
Początki rewolucji świata lektorów
Rok 2023 przyniósł ogromny rozwój branży sztucznej inteligencji, o czym wspominałem tu już nie raz. Najczęściej jednak wymieniane są LLMy, czyli czatboty AI pokroju ChatuGPT, czy Barda przechrzczonego teraz na Gemini. Eleven Labs jest startupem AI innym, niż wszystkie pozostałe, ponieważ skupia się na całkowicie innej kwestii. Eleven Labs nie generuje tekstów, czy obrazów, ale realistyczny, ludzki głos.
Startup w 18 miesięcy rozrósł się do tak gigantycznych rozmiarów, że stał się pierwszym polskim jednorożcem branży sztucznej inteligencji, czyli firmą o wartości przekraczającej miliard dolarów. W ciągu tego czas użytkownicy wygenerowali już łączną długość 100 lat nagrań audio, firma rozrosła się do 40 pracowników, zaś akcjonariuszami stały się takie grube ryby, jak Andereessen Hotowitz, Daniel Gross, czy Smach Capital.
Profesjonalny głos lektora dzięki kilku promptom
Eleven Labs to prawdziwa rewolucja, jeśli chodzi o dźwięk generowany przez sztuczną inteligencję. Choć o polskim startupie z początku było raczej dość cicho, tak możliwość realistycznie brzmiącego głosu w zaledwie kilka sekund, zdobyła viralowe zasięgi. Generatory głosu są z nami praktycznie od początków polskiego internetu. Kto nie pamięta śmiechów przy przeróbkach z syntezatorem głosu Ivona, nie pierwszy rzuci mikrofonem!
Eleven Labs, to jednak coś całkowicie nowego, gdyż pozwala na uzyskanie nie tylko naturalnie brzmiącego głosu, ale także konkretnej intonacji. To właśnie intonacja syntezatora Ivony była dla nas taka śmieszna. W przypadku Eleven Labs nie zorientujesz się nawet, że czytany tekst został wygenerowany przez AI. Poniżej przykład:
@kaizenads Czy w mrocznej przyszłości jest jeszcze miejsce na miłość? Sprawdź to w mini-komiksie, który stworzył nasz AI Specialist Jeremiasz Krok. #kaizenads #sztucznainteligencja #ai #agencjamarketingowa #future #japan #cyberpunk #viral #japantiktok #robotics #futuretech #japantechnology #tiktok
Do wyboru jest obecnie ponad 40 różnych lektorów AI. Dostępne są zarówno męskie, jak i żeńskie głosy. Co więcej, istnieje także wgrania własnych nagrań audio i wideo, aby AI skopiowało dany głos, co nazywane jest Speech to Speech.
Z Eleven Labs Dubbing może wejść na całkowicie nowy poziom
Z dubbingiem jest jak z zupą pomidorową – jedni uwielbiają, drudzy nienawidzą. Niemniej jednak to właśnie w wersji dubbingowej najczęściej oglądamy filmy animowane, czy klasyki, takie jak seria filmów o Harrym Potterze. Eleven Labs przychodzi zrewolucjonizować także tę branżę. Sztuczna inteligencja od polskiego startupu całkiem nieźle radzi sobie z dubbingowaniem klipów wideo.
Co istotne, dubbingowane głosy zachowują swoją oryginalną barwę. Na ten moment dostępna jest zdecydowana większość języków, na które można dubbingować dane nagranie wideo. Dokładność tłumaczeń jest na ten moment naprawdę dobra, jednak oczywiście zdarzają się mniejsze lub większe błędy. Biorąc pod uwagę szybkość rozwoju AI, można spokojnie potraktować to, jako moment przejściowy.
Jakie możliwości pokaże już niebawem?
Z możliwości Eleven Labs korzysta stale rosnąca liczba osób, zaś polski startup szczególnie popularny jest na TikToku, gdzie głos AI wykorzystywany jest jako lektor krótkich filmików. Twórcy startupu wstawili także na swoim oficjalnym kanale YouTube ponad 2-godzinny audiobook „Alicja w Krainie Czarów”, czytany wyłącznie przez AI. Robi wrażenie.
Niemniej jednak Eleven Labs nie zamierza się zatrzymywać i pędzi z nowymi funkcjonalnościami. Jedną z nich, która jest już dostępna dla użytkowników, to możliwość sklonowania swojego głosu umiejscowienia go w sklepie. Użytkownik dostanie wynagrodzenie za każdym razem, gdy ktoś zdecyduje się użyć jego głosu.
Kolejna nowość została ogłoszona w wyjątkowo sprytny sposób. Kiedy nie opadł jeszcze kurz po prezentacji przez OpenAI nowego generatora wideo, czyli Sory, Eleven Labs ogłosiło swoją nowość. Wykorzystali oni kompilację zaprezentowanych klipów Sory i pokazali światu nowe narzędzie, nad którym pracują. Jest to model AI, który generuje dźwięki na podstawie klipów wideo, zdjęć i tekstu. Choć o nowości nie wiadomo tak naprawdę nic poza tym, co prezentuje klip na social mediach.
W Kaizen Ads (カイゼンアッズ)
AI występuje nie tylko w naszej nazwie 🙂
Zapraszamy do śledzenia naszej nowej Serii:
愛とAI – “Ai to AI” – w wolnym tłumaczeniu “Z miłości do AI”
Jeśli zastanawiasz się jak wdrożyć AI do swojego biznesu lub chcesz żebyśmy przeprowadzili dla Ciebie szkolenie z ChatGPT, Midjourney i innych narzędzi opartych o sztuczną inteligencję daj znać.
Wyślij wiadomość
kontakt@kaizenads.pl
Zadzwoń:
+48 881 228 124
Komentarz specjalisty