W uchu cyklonu – czyli afera audialna

Krzysztof Marciniak / 26 Cze 2014

„Całe dostępne nagranie” rozmowy, od której rozpoczęła się obecna afera podsłuchowa, przeładowane jest informacjami, których przeciętny obserwator życia publicznego nie ma w zwyczaju przyswajać. Od czasu publikacji materiału dźwiękowego w sieci minęło już ładnych parę dni, a media i ich odbiorcy wciąż błądzą jak dzieci we mgle w sprawie krytyki tak zwanych „taśm”. Nie powinno to nikogo dziwić: ktoś, kto sterował upublicznieniem dyskusji panów Sienkiewicza, Belki i Cytryckiego, zaserwował nam nie tylko polityczne trzęsienie ziemi, ale też najprawdziwszą burzę informacyjną. Natomiast rzeczą absolutnie kluczową jest tu fakt, że w oku medialnego cyklonu znalazło się tym razem nie zdjęcie, nie film, nie projekt ustawy czy spisany dokument, a ponad dwugodzinny plik dźwiękowy. Dla zdominowanej przez kulturę wizualną zbiorowości jest to przedmiot ulotny, obcy i absolutnie niezrozumiały.

Na najbardziej podstawowym poziomie mój postulat tyczyłby się oczywiście konieczności uważnego wysłuchania i zrozumienia wszystkich słów wypowiedzianych przez podsłuchanych polityków – już pod tym względem redakcja „Wprost” spektakularnie poległa przy spisywaniu stenogramów. Jednak na nagraniu znalazło się również zatrzęsienie innych dźwięków, spośród których przynajmniej część domaga się przemyślenia i głębszej analizy. Paradoksalnie właśnie te, towarzyszące nagrywaniu rozmowy, dźwięki mogą nam powiedzieć sporo o twórcy pliku – niekoniecznie tożsamym z autorem samego nagrania.

O ile ktoś zdołał wysłuchać w całości zamieszczone w sieci nagranie, zapewne i tak odruchowo przewinął początkowych 25 sekund niezwykle nieprzyjemnych dla ucha szumów i trzasków. Jednak w kontekście rejestracji dźwięku moment rozpoczęcia i zakończenia nagrania jest tym, czym kadrowanie dla fotografii – powinniśmy więc przysłuchać się uważnie, co znalazło się w dźwiękowym kadrze, a co pozostało poza nim. Nagranie rozpoczyna się czternastoma sekundami hurczącego łomotu, z którego co i rusz wyłaniają się głośniejsze dudnienia, potem następuje około siedmiu sekund cichszych usterek, na tle których słyszymy już głosy polityków, a następnie kolejne cztery sekundy dudniącego w uszach zgrzytania, po którym dopiero (w 25. sekundzie nagrania) zaczyna być słychać klarownie rozmowę. Szmery te nie są pozbawione znaczenia – to przypuszczalnie dźwięk mikrofonu pocieranego przez materiał ubrania albo skórę dłoni osoby wnoszącej pluskwę na salę. Głośniejsze dudnienia natomiast odpowiadają krokom podsłuchującego. Szum mikrofonu mającego styczność ze skórą lub materiałem jest brzmieniem dość charakterystycznym, trudnym do pomylenia, choć zastrzec należy, że przy jakości udostępnionego nagrania wszystko pozostaje jedynie w sferze domysłów.

 

 
Obwiednia dźwięku pierwszych 25 sekund nagrania w porównaniu z późniejszym poziomem głośności.

Obwiednia dźwięku pierwszych 25 sekund nagrania w porównaniu z późniejszym poziomem głośności.

 

Pod sam koniec tej hałaśliwej sekwencji następuje jednak (00:24-00:25) dźwięk zupełnie inny od poprzednich. Jakkolwiek dziwnie to zabrzmi – prawdopodobnie możemy w tej sekundzie „usłyszeć” mikrofon. Znowu, wobec jakości nagrania mój wniosek pozostaje tylko jedną z możliwych interpretacji, ale jest to brzęknięcie podobne do tego, jakie wydałby mały breloczek wrzucany do niewielkiego wazonika (przedmiot odbija się od dna naczynia, słychać typowy „butelkowy” pogłos). Ważne jest jednak nie to, czego możemy się domyślać na tej podstawie o technologii zastosowanego podsłuchu, ale to, co z tej 25-sekundowej sekwencji dźwiękowej wynika dla rozwoju zdarzeń. Otóż: ktoś wchodzi do pomieszczenia, w którym już rozmawiają dwaj politycy i dopiero wtedy ukrywa mikrofon (albo też nagranie zostało tak umiejętnie zmontowane, żebyśmy mogli tak pomyśleć). Pracownicy restauracji, a być może nawet sami bohaterowie „taśm”, mogą z łatwością zidentyfikować na tej podstawie osobę, która umieściła podsłuch. Mamy więc do czynienia z nagraniem, z którego nie wycięto procesu ukrywania mikrofonu. Już na tej podstawie można było chyba wywnioskować, że Polską nie trzęsie żaden „spisek kelnerów” – osoba bezpośrednio odpowiedzialna za podsłuch bardziej postarałaby się o zatarcie śladów swoich działań. Można by wręcz­­­­ przypuszczać, że osoby nagrywające i zastosowane przez nie techniki zostały przez twórcę pliku podane organom ścigania… na tacy.

Skoro mowa była o „wykadrowaniu” nagrania, warto sięgnąć też do jego zakończenia. Urywa się ono bowiem (2:11:23) w połowie zdania, akurat w momencie, w którym prezes NBP – po kilkudziesięciominutowej dygresji – porusza temat swojej pozytywnej (!) oceny działań ministra Rostowskiego w sprawie OFE. Twórca pliku w tym miejscu bezpardonowo ucina nagranie. Oczywiście może być to efekt usterki technicznej podsłuchu (rozładowania się baterii lub zapełnienia karty pamięci w urządzeniu nagrywającym) i nie można tego logicznie wykluczyć. Byłoby jednak wyjątkową naiwnością wierzyć ślepo, że nagranie urywa się w tak newralgicznym momencie przez przypadek. A jeśli byłby to zabieg świadomy, to czym umotywowany? Możemy przynajmniej podejrzewać, że o ile twórcy pliku nie zależało (łagodnie mówiąc) na „kryciu” osób, które podłożyły podsłuch, o tyle nie miałby większych skrupułów manipulować kształtem upublicznionych wypowiedzi polityków. Manipulacji tych mógłby się dopuścić – subtelniejszymi metodami – również w toku nagrania.

Wróćmy więc do początku. Pierwszych dziesięć minut pliku stanowczo różni się pod względem otoczenia akustycznego od późniejszego przebiegu rozmowy – w tle słychać muzykę, szumy samochodów dobiegające z ulicy, brzęk naczyń, tło akustyczne jest więc bogate. Sytuacja zmienia się diametralnie około 11:40, kiedy to zanika zupełnie muzyka, a pomieszczenie, w którym odbywa się rozmowa, zostaje zamknięte i wyciszone. Jeśli pokój, w którym podsłuchiwano polityków, media określają mianem „studia”, to trudno się z tym nie zgodzić – stworzone zostały w nim bowiem idealne warunki do nagrywania. Szczególnie zastanawiającym jest fakt zupełnego wyciszenia muzyki w tle. Jest ona oczywiście hałasem utrudniającym rejestrację dźwięku, ale jej obecność stanowiłaby także przeszkodę dla późniejszej manipulacji wypowiedzi poprzez montaż pliku. Logika i rytm języka, w połączeniu z czasowym przebiegiem utworów muzycznych doprowadziłyby do tego, że niełatwo byłoby pociąć i niepostrzeżenie zmanipulować którykolwiek z fragmentów rozmowy.

Nie podejmę się wyszukania w nagraniu miejsc, w których możliwa była edycja materiału dźwiękowego – tym bardziej, że nie dysponuję narzędziami ani wiedzą, które pozwalałyby mi taką manipulację udowodnić. Niemniej jednak znajdują się na nagraniu fragmenty (por. 16:10-16:30, 23:20-23:30, 30:10-30:30), które mogą budzić wątpliwości ze względu na nagłe – i nie tak do końca uzasadnione wejściami kelnera, lub wznoszonym toastem – urwania wątków rozmowy. Dodajmy, że we wszystkich tych przypadkach „dokończenie wątku” działałoby niewątpliwie na korzyść wizerunku osoby podsłuchiwanej. O wiele jednak łatwiej niż udowodnić manipulację plikiem, jest w tym przypadku samodzielnie jej dokonać – poniżej załączam słynny fragment (1:25:20 i dalej) o Polskich Inwestycjach Rozwojowych ale… pozbawiony wulgarnego bon motu ministra Sienkiewicza.

 

 

Wycięcie kompromitującego fragmentu o „chuju, dupie i kamieni kupie” zajęło mi zaledwie kilka minut i dokonałem tego będąc zupełnym amatorem w zakresie edycji nagrań (przy użyciu oprogramowania powszechnie dostępnego w sieci). Od nagrania minął zaś rok. Jeśli więc prawdą jest, że celem „źródła” nagrań było uderzenie w wizerunek podsłuchiwanych polityków, wówczas można się zastanawiać, czy w podobny sposób nie „zniknęło” z opublikowanej rozmowy parę ważnych kwestii, które akurat nie pasowały do tego (lub innego) zamierzenia. Wszelkie publikowane w toku afery nagrania nie mogą być przecież traktowane bezkrytycznie – musimy mieć świadomość, że usłyszymy dokładnie to, co ktoś zechce, abyśmy usłyszeli. Możliwości edycji nagrań są ogromne, a podobne manipulacje nie są wcale łatwe do wykrycia – na poniższym spektrogramie „ocenzurowanego” przeze mnie nagrania nie sposób dostrzec śladów dokonanego zabiegu.

 

spektrogram zmanipulowanego przeze mnie pliku, kliknij aby powiększyć.

spektrogram zmanipulowanego przeze mnie pliku, kliknij aby powiększyć.

 

Już wobec tych kilku powierzchownych obserwacji widać więc, że mamy do czynienia z aferą zupełnie nietypową, której audialne źródło nieznanego pochodzenia należy poddać uważnej krytyce. Nie wątpię, że specjaliści w odpowiednich służbach pracują nad analizą materiału samych nagrań od chwili ich udostępnienia (także nad analizą struktury samego zapisu cyfrowego, która być może pozwoliłaby stwierdzić, czy materiał nie został zmanipulowany). Jednak w mediach próżno byłoby doszukać się choćby prób krytycznej oceny plików stanowiących klucz do całej afery. Podążając tą drogą można oczywiście stworzyć piramidalne bzdury, ale nawet najbardziej chybione próby interpretacji plików dźwiękowych pozwoliłyby opinii publicznej wytworzyć zdrowy dystans do źródeł, którymi dysponujemy.

Ilość informacji zawartych w nagraniu dźwięku jest właściwie nieograniczona, a wycięte z kontekstu urywkowe stenogramy cytowane w mediach wciąż przeinaczają i spłaszczają przekaz, przyczyniając się do prawdziwej lawiny dezinformacyjnej. Chcąc dać jej odpór, możemy jedynie zamknąć oczy i wsłuchać się w trzeszczące dźwięki nagrań, jak w dziwną audycję radiową przygotowaną przez tajemniczego nadawcę.­­ Jednak nawet słuchając na własną rękę tak zwanych „taśm prawdy” musimy zdawać sobie sprawę, że tak jak nigdy nie miały one nic wspólnego z taśmą magnetofonową, a ich nośnikiem są pliki cyfrowe, tak też zawarta na nich „prawda” jest wytworem czyjejś kreatywności i jako taka, uszyta została na miarę swego twórcy.

Krzysztof B. Marciniak