ABC Dostępności: N jak Napisy na żywo
Napisy na żywo to bardzo wygodne rozwiązanie – nie tylko dla osób, które nie są w stanie usłyszeć mówcy. Jednak mało kto wie, jak złożony proces towarzyszy ich tworzeniu. W kolejnym artykule z cyklu „ABC Dostępności” opowiadamy, gdzie stosuje się napisy na żywo, jak się je tworzy i jak powinny wyglądać, a także podpowiadamy... jakich błędów nie popełniać przy ich zamawianiu.
Dla kogo są napisy na żywo?
Powstały z myślą o osobach niesłyszących, zwłaszcza tych, które utraciły słuch, ale komunikują się w języku polskim, przeważnie nie nauczyły się języka migowego, a także tych, które nie słyszą od urodzenia, ale ich głównym językiem nie jest język migowy.
Bardzo dużą grupą odbiorców są też osoby słabosłyszące, które używają napisów na żywo jako narzędzia wspierającego – mogą doczytać to, czego nie usłyszą. Są to także osoby starsze, których w Polsce będzie raczej przybywać, a które nie zawsze chętnie korzystają z aparatów słuchowych.
Z napisów korzystają też osoby, które mają np. dysleksję. Komunikat otrzymany dwoma kanałami pozwoli im się lepiej na nim skupić.
Napisy będą też sporym ułatwieniem dla tych, którzy nie mówią biegle po polsku. Mogą się nimi wesprzeć, by lepiej zrozumieć przekaz. Z kolei jeśli polskie napisy towarzyszą np. konferencji odbywającej się w języku obcym, będzie to pomoc dla każdego, kto tego języka nie zna lub nie czuje się w nim pewnie.
Napisy na żywo pomogą w końcu każdemu, kto akurat nie może w swoim urządzeniu korzystać z dźwięku. Wystarczy zapomnieć zabrać słuchawek i znaleźć się w zatłoczonym tramwaju, bibliotece czy miejscu pracy, w którym obok siedzą koledzy.
Gdzie powinno się stosować napisy na żywo?
Wszędzie tam, gdzie kluczowe jest rozumienie mowy. Są to więc nadawane na żywo programy telewizyjne, takie jak serwisy informacyjne, audycje publicystyczne, konferencje prasowe, ale też inne popularne programy (jak nadawany swego czasu z napisami na żywo „Taniec z Gwiazdami”).
To także różnego rodzaju konferencje stacjonarne i online, ale też gale oraz wydarzenia związane z kultem religijnym (choć tu będą to napisy na żywo łączone z przygotowanymi wcześniej).
Kolejnym obszarem jest edukacja – są na świecie uczelnie, na których standardem jest możliwość uzyskania przez studenta transkrypcji na żywo całych wykładów. Napisy na żywo bywają też stosowane, także w naszym kraju, przy nauce języka obcego przez osoby słabosłyszące.
Warto przy tym podkreślić, że w Polsce są na razie dwa przypadki, w których napisy na żywo – wprost lub nie – są wymagane przepisami.
- Dla telewizji konkretne obowiązki dotyczące m.in. napisów wprowadziło Rozporządzenie Krajowej Rady Radiofonii i Telewizji z 15 listopada 2018 r. w sprawie udogodnień dla osób niepełnosprawnych z powodu dysfunkcji wzroku i osób niepełnosprawnych z powodu dysfunkcji narządu słuchu w programach telewizyjnych, wydane na podstawie Ustawy o radiofonii i telewizji. Zgodnie z przepisami, od 2024 roku większość kanałów ma zapewniać dostępność dla osób z różnymi rodzajami niepełnosprawności co najmniej połowy programu, a w poprzedzających ten termin latach wskazany procent jest niższy. W przypadku kanałów informacyjnych już w 2021 r. 22 proc. audycji ma mieć napisy. Ponieważ specyfiką tych kanałów jest nadawanie na żywo, siłą rzeczy już teraz niezbędne są napisy na żywo.
- Napisy na żywo muszą też być zapewnione w transmisjach online finansowanych z funduszy unijnych, zgodnie ze Standardami dostępności dla polityki spójności 2014-2020 (plik PDF; 3,48 MB). Dotyczy to więc transmisji online np. konferencji i wszelkich wydarzeń realizowanych ze środków UE.
Jak się tworzy napisy na żywo?
Respeaking
Najbardziej efektywna, a w Polsce jedyna możliwa, jest metoda respeakingu. Czym ona jest? Otóż w procesie tworzenia napisów na żywo stosuje się oprogramowanie do rozpoznawania mowy, które zamienia ją na tekst. Program może to robić automatycznie, ale o wiele lepiej jest, gdy ktoś powtarza to, co powiedział mówca. Ten ktoś to respeaker. Siedzi przy mikrofonie i, dysponując dobrą dykcją, wyraźnie powtarza po mówcy kolejne słowa i zdania. Dodaje znaki interpunkcyjne, komendy techniczne (np. „nowa linia”) i ew. oznacza, kto akurat mówi, dzieli także długie zdania na krótsze. Zamieniona z mowy na tekst treść trafia do edytora tekstu. Następnie moderator, czyli druga osoba, wychwytuje błędy, koryguje je, dzieli treść na wiersze i wysyła do emisji.
W Polsce, ale też np. we Włoszech, respeaking jest realizowany właśnie w takich „teamach”: respeaker i moderator. Są kraje, jak Wielka Brytania czy USA, gdzie obie funkcje wykonuje często ta sama osoba. Z kolei we Francji nad napisami na żywo pracują jednocześnie minimum trzy osoby (trzecia z nich raz jeszcze sprawdza zapis). Inna jest po prostu specyfika różnych języków, a także związane z tym możliwości programów do rozpoznawania mowy. Co ważne, respeakerzy i moderatorzy pracują w kabinach przeznaczonych dla tłumaczy lub miejscach odizolowanych akustycznie. Przy dłuższych wydarzeniach, tak jak tłumacze symultaniczni, respeaker i moderator mają swoich zmienników. Zmieniają się podczas pracy nie rzadziej niż co pół godziny.
Wracając na chwilę do oprogramowania, na świecie najchętniej stosuje się program o nazwie Dragon, ale nie jest on dostępny dla języka polskiego. W naszym kraju sprawdza się m.in. czeski Newton. Oprogramowanie do rozpoznawania mowy oparte jest na sztucznej inteligencji. Przed tworzeniem napisów dobrze jest więc trochę je podszkolić, czyli wprowadzić słownik z fachową terminologią danego programu czy konferencji, właściwie zapisanymi nazwiskami uczestników, markami prezentowanych produktów itd.
W praktyce część napisów nadawanych na żywo jest przygotowywanych wcześniej – gdy np. w programie informacyjnym nadawany jest reportaż albo gdy podczas konferencji jest odczytywany list. Te opracowane wcześniej napisy także są jednak emitowane ręcznie na żywo przez twórców napisów.
Inne metody
Respeaking to najlepsza z metod, jednak w niektórych zastosowaniach testowany jest automat (sam program rozpoznający mowę) plus korekta w wykonaniu człowieka. Takie rozwiązanie ma szansę sprawdzić się, gdy mówca ma znakomitą dykcję, wokół niego panują świetne warunki akustyczne (raczej studio nagrań niż kawiarnia), a mowa jest dość wolna.
Jeszcze inną metodą, stosowaną raczej w innych krajach, jest szybkie pisanie na specjalistycznej klawiaturze. Nie chodzi o bezwzrokowy zapis literowy, lecz wpisywanie od razu sylab. Jest to metoda bliższa stenotypii.
Jak powinny wyglądać napisy na żywo?
Sposób prezentacji napisów na żywo można podzielić na trzy rodzaje:
- w audycjach telewizyjnych napisy są złożone z dwóch linijek (wierszy) tekstu, które wyświetlane są najczęściej na dole; jeden wiersz składa się z 32-38 znaków,
- w transmisjach online napisy składają się z dwóch lub trzech wierszy i nie jest tak restrykcyjnie przestrzegana liczba znaków w wierszu – kluczowe jest, by napisy były czytelne zarówno w komputerze, jak i na urządzeniu mobilnym,
- trzecim rodzajem są napisy wyświetlane w miejscu obsługiwanego wydarzenia jako blok tekstu (6-10 linijek), zajmujące cały ekran, widoczne dla jego uczestników.
Napisy nie mogą kolidować z tłumaczem języka migowego ani z innymi napisami, np. wizytówkami występujących osób. Czcionka powinna być bezszeryfowa, choć jej wygląd zależy od zastosowanego playera czy konkretnego kanału telewizyjnego. Musi się charakteryzować wysokim kontrastem w stosunku do tła.
Należy zaznaczać ewentualną zmianę mówcy, zwłaszcza że nie zawsze ich widać na ekranie. Identyfikuje się ich w napisach na dwa sposoby. W telewizji – kolorem, a w innych przypadkach można opisywać ludzi tzw. wizytówkami, czyli np. nazwiskiem albo inicjałami, lub poprzez oznaczenie strzałkami zmiany mówcy. Dodaje się też w nawiasie ważne dźwięki, inne niż głos mówcy, np. owacje.
Jak w każdym tłumaczeniu, także w napisach na żywo jest pewne opóźnienie. Nie powinno to być więcej niż 10-15 sekund, natomiast w telewizji brytyjskiej dąży się do opóźnienia w wymiarze 3-5 sekund. Można tu zastosować pewien trick, polegający na opóźnieniu sygnału, by zrównać go z tempem pojawiania się napisów. Generalnie jednak odbiorcy tolerują tak małe opóźnienia, ważniejsza jest dla nich możliwość śledzenia całego wydarzenia.
Choć napisy powstają w dużym tempie, muszą mieć odpowiednią jakość. Dopuszczalną wartością na świecie (w Polsce nie ma norm jakościowych) jest 98 proc., przy czym różna jest waga ewentualnych błędów. Najwyższą ma zmienione słowo, które sprawia, że zdanie, choć ma sens, traci oryginalne znaczenie i przekazuje nieprawdę (np. dodanie „nie” przed wyrazem „przegłosowali”). Drugą kategorią błędów są te, gdy widzimy, że coś w zdaniu jest nie tak, dostrzegamy absurdalne w danym kontekście słowo, jednak nie deformuje ono przekazu. Najmniejsze znaczenie mają błędy fleksyjne, czyli „e” zamiast „ę”, a także np. kropka zamiast przecinka, mała litera zamiast wielkiej itd.
Jakich błędów nie popełniać przy zamawianiu napisów na żywo?
Błędne jest założenie, że napisy na żywo wystarczą do tego, by zapewnić dostępność przekazu osobom głuchym. Większości z nich na pewno pomogą, ale osoby, których pierwszym językiem jest polski język migowy, potrzebują tłumacza, zwłaszcza gdy podejmowany temat jest specjalistyczny. Należy więc założyć konieczność zapewnienia i napisów na żywo, i tłumacza języka migowego. Jest to szczególnie istotne, gdy nadawane są informacje nt. sytuacji kryzysowych (np. konferencja prasowa premiera), kiedy ważne jest, by przekaz trafił do wszystkich obywateli.
Błędem jest też myślenie, że „wystarczy kupić program do tworzenia napisów na żywo” i on sam je zrobi, bez opłacania respeakera i moderatora. Ta wizja „czystego zysku” kończy się nieprzyjemnie. Wystarczy, że program źle coś zrozumie i skandal gotowy. Raz zamieni „Bill Gates” na „Bill AIDS”, innym razem – co wynika z doświadczeń realizatorów napisów na żywo we wspomnianym „Tańcu z Gwiazdami” – gdyby nie obsługujący program ludzie, widzowie zamiast „tancerz” czytaliby „kanclerz”, a zamiast „piosenka” na ekranie byłaby „pisanka”. Owszem, jeśli mówca ma znakomitą dykcję, jest szansa, że program popełni tych błędów niewiele, ale podczas transmisji debaty lub sesji rady miasta, zwłaszcza gdy wiele osób mówi jednocześnie, dramat jest kwestią czasu.
Duży wpływ na jakość napisów będzie miało nieprzekazanie wcześniej osobom realizującym je na żywo materiałów dotyczących tematyki wydarzenia. Przydadzą się więc: plan konferencji z nazwiskami prelegentów, tezy ich wykładów czy wręcz treść wystąpień, lista gości, lista patronów. Robi się wtedy słownik, czyli uczy program konkretnych wyrazów, a niektóre elementy, np. przesłane wcześniej i odczytywane podczas wydarzenia listy od ważnych osób, wykorzystuje się w całości.
Jednak największym błędem jest niewłaściwa specyfikacja przy zamawianiu usługi napisów na żywo. Temat rozwija niżej w wypowiedzi eksperckiej Monika Szczygielska.
Ile kosztują napisy na żywo?
Trudno jest określić konkretną cenę, ponieważ zmiennych jest tu bardzo dużo. Inaczej będzie w ramach stałego kontraktu z telewizją, inaczej w przypadku całodniowej branżowej konferencji, a jeszcze inaczej, gdy swoje wydarzenie online chce w ten sposób przybliżyć szerszej grupie odbiorców organizacja pozarządowa.
Zmiennymi są też stopień trudności podejmowanej problematyki, język, w jakim trzeba pracować, bo napisy mogą być od razu tłumaczeniem np. z angielskiego, technologia, w jakiej realizowana będzie transmisja, a także odpowiedź na pytanie, czy wydarzenie odbywa się online, czy stacjonarnie.
Na pewno jednak można powiedzieć jedno: jest to tak złożona operacja, że nie opłaci się zrobienie tego jednorazowo samodzielnie. Zdecydowanie lepiej jest wynająć specjalistów.
Zastosowanie napisów na żywo w praktyce
Napisy na żywo podczas transmisji z konferencji PARP realizowane online, fot.: Dostępni.eu
Oto, jak powstają napisy na żywo w Zoom, fot.: Dostępni.eu
Napisy na żywo – ekspert radzi
Monika Szczygielska, specjalistka ds. dostępności i szkoleniowiec, szefowa zespołu tłumaczy Dostępni.eu, realizującego m.in. napisy na żywo do multimediów, programów TV i wydarzeń online
fot.: M. Pawluczuk
Napisy na żywo i napisy dla osób niesłyszących przygotowywane post factum to dwie różne usługi o innych wymaganiach. Do tych drugich od lat istnieją wytyczne, wiadomo więc dokładnie, jak mają wyglądać, że muszą być m.in. bezbłędnie opracowane i doskonale zsynchronizowane. Przy napisach na żywo poziom wyzwania rośnie. Najważniejsze jest to, aby minimalizować opóźnienie i jak najwierniej przekazywać treść, by napisy miały jak największą wartość. Kluczowym błędem, który się pojawia w zamówieniach publicznych, jest mylenie tych dwóch usług i wymaganie specyfikacji dla napisów dla osób niesłyszących post factum przy zamawianiu napisów na żywo do transmisji z wydarzeń.
Przykładowo nierealne jest jednoczesne wymaganie napisów zamkniętych i oznaczanie mówców kolorami na YouTube. Kiedy widzę taki zapis wiem, że nikt nie zadał sobie trudu, by sprawdzić, że najpopularniejszy player nie obsługuje kolorów w napisach. Przygotowując napisy zgodnie z taką specyfikacją stracimy identyfikację mówców. Tak samo pozbawione sensu jest wymaganie, że napisy na żywo mają mieć do 40 znaków i być w dwóch liniach. Rzecz w tym, że jeśli tych znaków jest trochę więcej, a napisy są w trzech liniach, to człowiek dostaje szerszy kontekst. Jak się zgubi, łatwiej mu odzyskać wątek, gdy ma kilka słów więcej na ekranie.
Kolejny temat to wymóg braku opóźnienia, co świadczy o kompletnym braku zrozumienia, czym są napisy na żywo. Warto też pamiętać, że jeśli napisy mają być użyteczne dla odbiorców, nie mogą być realizowane automatycznie. Absolutne minimum to moderacja przez człowieka napisów z automatycznego rozpoznawania mowy, ale to się sprawdzi tylko przy niektórych wydarzeniach. Natomiast w Polsce akceptowalna jakość napisów na żywo jest do osiągnięcia wyłącznie przy użyciu metody respeakingu z moderacją.
Trzeba też wiedzieć, że im wcześniej zamówimy usługę, tym większą mamy pewność, że zostanie właściwie zrealizowana. Jak przy każdym innym tłumaczeniu, jeśli zamawia się je na ostatnią chwilę, to trzeba pogodzić się z tym, że prawdopodobnie nie będzie możliwości realizacji usługi. Kolejna rzecz to przekazanie kompletu materiałów. Jeżeli chcemy osiągnąć wysoką jakość tłumaczenia, musimy przekazać materiały, by napisowcy mogli przygotować słownik. Chodzi o wszystko, co jest na piśmie, czyli program, scenariusz, prezentacje, wystąpienia, które zostały spisane, lub chociaż temat, tezy i kluczowe słownictwo. To naprawdę jest osiągalne. Skoro odpowiednio wcześniej dostaliśmy homilię papieską przed mszą kanonizacyjną Jana Pawła II czy innym razem otrzymaliśmy przemówienie komisarza unijnego, to mam uwierzyć, że nie możemy dostać z wyprzedzeniem wystąpienia profesora albo urzędnika?
Cykl: ABC Dostępności
O niektórych ludziach mawia się, że widzą drzewa, ale nie widzą lasu. Z dostępnością architektoniczną jest podobnie.
Inwestorom, zarządcom budynków, architektom wydaje się czasem, że wystarczy do budynku dodać pochylnię i potrzeby osób z niepełnosprawnością są zaspokojone. Nie jest to prawda. Różne są przecież potrzeby osób poruszających się na wózkach, niewidomych, głuchych czy z niepełnosprawnością intelektualną, ale i rodziców z małymi dziećmi, podróżnych z bagażami, kurierów z paczkami. Dlatego dostępność budynków i przestrzeni należy traktować kompleksowo, aby każdy czuł się bezpiecznie i komfortowo, korzystając z nich samodzielnie.
Z drugiej jednak strony, różne składowe dostępności służą osobom o różnych potrzebach, a dla reszty są często niezauważalne. Każda z tych składowych ma swoje zasady. Dlatego w ramach cyklu „ABC Dostępności” chcemy je rozłożyć na czynniki pierwsze. Wspólnie m.in. z ekspertami Integracja LAB tłumaczymy, komu konkretne rozwiązanie służy, gdzie powinno się je stosować, jak działa, jak powinno wyglądać oraz ile kosztuje. Opowiadamy też, jakich błędów nie popełniać przy projektowaniu i budowie lub montażu, a na przykładach prezentujemy prawidłowe jego zastosowanie.
W ramach cyklu „ABC Dostępności” pokazujemy więc drzewa, nie zapominając przy tym, że dopiero wspólnie tworzą las.
Polecamy także:
- D jak Drzwi
- D jak Dźwig osobowy
- F jak Flexstep
- I jak Informacja (wizualna, dźwiękowa, dotykowa)
- K jak Kontrast
- Ł jak Ławka
- M jak Muszla ustępowa
- N jak Nawierzchnia
- P jak Platforma przyschodowa
- P jak Pochylnia (zwana też Podjazdem)
- P jak Podnośnik pionowy
- P jak Pole manewrowe
- P jak Poręcz
- P jak Poręcze łazienkowe (zwane też Uchwytami)
- P jak Prysznic (zwany też Natryskiem)
- R jak Recepcja
- S jak Schodołaz
- S jak Schody
- S jak System wzywania pomocy do toalety
- T jak Tekst łatwy do czytania i zrozumienia (ETR)
- T jak Tłumacz języka migowego
- U jak Umywalka
Artykuł powstał we współpracy z Bankiem Gospodarstwa Krajowego
Komentarze
brak komentarzy
Dodaj komentarz