Description Creating subtitles by crowdsourcing! Contact Percidae for information and coordination.

Erstellen von Untertiteln durch crowdsourcing! Melde dich bei Percidae für weitere Information und Koordinierung.

Has website www.twitter.com/c3subtitles, https://subtitles.pads.ccc.de/info, http://subtitles.media.ccc.de/
Persons coordinating Percidae
Persons working on Kay, Percidae, Sebi
Located at assembly Anywhere you are! Überall wo du bist!
Other projects...

Page to all pads and amara.org Links: subtitles.media.ccc.de

Please take a look at the "Style Guidelines" below before diving into subtitling talks - thank you!

Bitte schau dir an wie gute Untertitel aussehen sollen bevor du los legst: "Wie sehen gute Untertitel aus?" - Danke!

You can leave us feedback here: https://subtitles.pads.ccc.de/feedback especially things you think we can do better next C3 (don't forget, it was the first time in this great framework). We are already creating a list of "to dos" for next time : )



English project description

This project aims to provide subtitles in the original language and translations into other languages. They are supposed to be available on the file servers which also distribute the videos of the talks.

The first goal is to provide a more barrier-free viewing experience, especially for people with hearing impairment. In addition, people not fluent in german or english can benefit from that, because the translation of already existing subtitles in other languages is quite easy and much faster than creating them from scratch.

As software we want to use www.amara.org because it is almost perfect for crowdsourcing. It guides you through the whole process of the creation of the subtitles and afterwards also the translations step by step. You can stop any time and any other person can start over at the point you left the workflow.

If you want to participate you will need an account at www.amara.org but you can also register there with your twitter, facebook, openID, google, TED or Udacity account.

If you have any questions don't hesitate to contact me ( Percidae )!

Process

During the talk

During the presentation, the speech of the lecture can also be recorded in a Etherpad. The address is: subtitles.pads.ccc.de/$lecture_number , so in the case of the presentation number 1337: subtitles.pads.ccc.de/1337

It is completely normal that you can not even at typing speeds of 300-400 strokes per minute come along ! That's not bad, but at least helps to create a rough skeleton.

The more people look at the same time on the pad , the more likely inaccuracies or missing points can be added even during the lecture.

If you train a good speech recognition software in the language of presentation after your own voice, please contact me ( Percidae ) , then we can use it to start a test run.

After the talk

There will be an extra video file that contains only the original language so that it can be used together with www.amara.org . You can find that here: http://subtitles.media.ccc.de the link to the pad and the amara.org link.

Amara.org shows you each step before a video of how it works . Look at it yourself , then you should have no problems with the edit .

amara.org

First step

In the first step on the amara.org text snippets can be used from the pad and the rest will be added , so that all text completely as said lands in amara.org.

Second step

In the second step on amara.org the subtitles are roughly matched.

After the second step you are asked for a title, please enter the name of the talk and nothing else in the field.

Third step

In the third step on amara.org the subtitles are fine-tuned.

Fourth step

In the 4th Step is considered the video with the subtitles again and last inconsistencies are eliminated.

If you are the first one to do that please leave the talk as "incomplete" and the person who is reviewing it can than mark it as "complete". Also use the comment function of amara to every talk to tell the people after you, what to do or not to do anymore.

Translate with amara.org

When the talk is subtitled in the original language it can be translated. This is very easy with amara.org and is far less expensive than rebuilding the subtitles themselves. Please only start with the translations if the original subtitles were already marked as "reviewed" in the comments. If you don't stick with that process and someone changes something in the original language ugly problems with the editor can occur.

Finished subtitles

If a subtitle file is finished, we will add them to the video files on the servers, we use the *.srt format. Unfortunately the process is not finished yet, but will follow.

Style Guidelines

In short: Control chars – ()[]** –: fewer are better Content: if applicable word for word

These guidelines are the result of a lot of discussion including sing language interpreter also doing subtitles and a deaf person using subtitles. Also I used this (german): http://www.ndr.de/fernsehen/zuschauerservice/untertitel/utstandards100.html

The following was our common result:

  • in dialogs the person speaking has to be indicated. Full names are only useful when first using them. After that please use a form of abbreviation. If you use first names or family names is up to you (different might be appropriate from talk to talk), but the prinpipal is always: the shorter the better!
    • example:
Constanze Kurz: welcome! 
*applause*
Kurz: nice to have you here!
Frank Rieger: also a warm welcome from me, too!
Rieger: …
    • example: (only first/nick names are known)
Laura: Hi Alice! Hi Bob! 
B: Hi Laura, how're you?
A: Hi!
L: I'm fine, thanks!
  • No parenthesis around names!
  • dialog between only two people can be further simplified:
    • example:
- Hey, everything's fine? 
- yes, how about you?
- all done and dusted
- then we'll see each other tomorrow!
  • cuttings are allowed, but should be avoided. "Ehm"s, stumbling or words that were said twice can be omitted, but not if they're important (e.g. for a joke)
  • Subtitles are in direct speech, but no quotation marks, except there's really a quote.
  • numbers should be written in digits, because that's shorter. If readability is affected, you can write numbers in words (mostly only with numbers from one to twelve)
  • Sounds are marked with "*". For example
*applause* 
*laughing*
*loud laughing*
*boo*
*disquietness*
*phone ringing*
  • explicit linebreaks in amara can be created with [Shift]+[Return]
    • example:
Well, yes, thank you very much for your talk (linebreak)
*standing ovation*
  • in the Q&A part you can do it like that. Name at first appearence the Angel with "Angel:" or "XY Angel" if you want to specify the type of angel, questions with "Question:", answers as "Answer:". Later abbreviate to eather only the type of angel, e.g. "Audio:", "Signal:", "Herald:" or "Angel:" and abbreviate question and answer to "Q:" and "A:" for shortness.
    • example:
Herald Angel: We welcome to this talk Linus Torvalds, Richard Stallman,  
*raging applause*
Herald: … Bill Gates and Steve Jobs.
*cautios applause*
Herald: And now have fun with the talk: "How does good software look like?"
Torvalds: Good evening
*applause*
Stallmann: Evening
*applause*
Gates: Good evening
*applause*
Jobs: Evening
*applause*
Stallman: Software must be free. That's the highest principle!
Gates: And how does the programmer make a living of it? Air and love?
Torvalds: My software is used on a huge bunch of devices and programmers are paid to develop that software, when it should be used on new devices.
Jobs: And what about the UI design? Only if it looks good software is also used!
Stallman: I want to use the CLI!
Gates: To send users back to the hell of text, after they got to know graphical user interfaces …
Jobs: … which YOU stole from US! There's still a court decision pending!
Stallman: Good concepts are always copied and further developed, just like with the code.
Torvalds: That reminds me of a specific line of code that was actually copied from Linux to Windows: "if OPEN BRACKET …


FAQ

I'm in a lecture and speak the language well and can type fast , how can I join?
Watch the Twitter account www.twitter.com/c3subtitles there always get the latest announcements and pad to take notes or look addresses on this page to the link to the pad to find.


'I'm in a lecture and speak the language to good, but can not type fast , how can I join?
You can still open the pad and correct if you see something that was missed by the people transcribing.


I look at the presentation of $somewhere_with_internet_connection, how can I join?
Open up the pad and see if you can correct. Write there live will not go - unless you are alone - because that has a delay of about half a minute . This is also very well suited to fill missing passages. A bigger delay is even better for corrections, so you don't interfere with those doing the initial transcription live. The audio only streams provide more delay.


I have seen the presentation neither live nor streamed , I still can not join?
Yes, the platform is to edit published with the corresponding links. There, anyone can edit.


What should I ever be able to join in, can?
Keyboard use, listen, open the browser, click .


I'm in a lecture, but all reserved seats for the logger are already taken , what can I do?
You can take notes from anywhere.


I do not trust myself to take notes in the current language, but could translate the existing subtitles.
If the subtitle is created in the original language, it can be created in other languages. Then you can help.


I do not have the nerve / patience / time to occupy myself for more than X minutes with it, or I have only short breaks in time, can I still join?
Never mind, you can always click the "Save and Exit" button and someone else can continue working on this point further. You can also leave a comment how far you proceeded for the next one.


What about other things besides language that you only hear but can not see how laughter, clapping or boos?
Please note and in the subtitles , for example, also insert with [loud applause][applaus] [laughing] .


I'm sitting in a lecture and would like to write there, but the Wi-Fi is just dead again, what can I do?
Make local copy a text file to write there with, later you can do it in the pad.


What should I look for in the subtitling, so that the subtitles are well used?
See: "Subtitles Guidelines" or here (German): http://www.ndr.de/fernsehen/zuschauerservice/untertitel/utstandards100.html


I've read all the FAQ questions through but my question is still not there ...
Then contact me : on Twitter : @ c3subtitles by mail : c3subtitles@privatdemail.net - sorry no eventphone anymore.



Deutsche Projekterklärung

Das Ziel dieses Projektes ist es in der Sprache des Vortrags sowie Übersetzungen davon, als Untertitel zur Verfügung zu stellen. Die Untertitel sollen später von den Servern verfügbar sein die auch die Video-Dateien der Vorträge verteilen.

Der erste Ziel ist es die Video auch für schwerhörige oder gehörlose Menschen durch Untertitel verständlich zu machen. Auch Menschen die weder Englisch noch Deutsch flüssig beherrschen können davon provitieren, da es viel einfacher ist und schneller geht Untertitel zu übersetzen anstatt sie von Grund auf neu zu erstellen.

Als Software haben wir uns für www.amara.org entschieden weil es sich sehr gut für crowdsourcing eignet. Es führt einem durch den vollständigen Prozess des Untertitel erstellens sowie danach durch den Prozess des Untertitel übersetzens Schritt für Schritt. Du kannst jederzeit aufhören mit dem bearbeiten und jeder andere kann dort weiter machen wo du unterbrochen wurdest.

Wenn du mitmachen möchtest brauchst du einen Account bei www.amara.org , du kannst aber auch einen schon bestehenden Account von twitter, facebook, openID, google, TED oder Udacity verwenden.

Falls du irgendwelche Fragen hast, kontaktiere mich einfach ( Percidae )!

Ablauf

Während dem Vortrag

Während dem Vortrag kann die Originalsprache des Vortrags in einem Etherpad mitgeschrieben werden. Die Adresse ist: subtitles.pads.ccc.de/$Vortragsnummer, also im Falle von der Vortragsnummer 1337: subtitles.pads.ccc.de/1337

Es ist völlig normal, dass man selbst bei Tippgeschwindigkeiten von 300-400 Anschlägen pro Minute nicht mitkommt! Das ist nicht weiter schlimm, hilft aber dabei zumindest ein grobes Gerüst zu erstellen.

Desto mehr Leute gleichzeitig auf das Pad schauen, desto eher können auch Ungenauigkeiten oder fehlende Stellen schon während dem Vortrag ergänzt werden.

Wer eine gute Spracherkennungssoftware in der Vortragssprache bereits nach der eigenen Stimme trainiert sein eigen nennt, darf sich auch bei mir ( Percidae ) melden, dann können wir damit einen Testlauf starten.

Nach dem Vortrag

Es wird eine extra Video-Datei geben, die nur die Originalsprache enthält damit diese zusammen mit www.amara.org verwendet werden kann. Wenn das der Fall ist wirst du auf http://subtitles.media.ccc.de einen Link zu dem Video auf amara.org finden. Amara.org zeigt dir vor jedem Schritt ein Video wie es funktioniert. Schau es dir an, dann solltest du keine Probleme beim bearbeiten haben


amara.org

1. Schritt

Im ersten Schritt auf amara.org können die Textschnipsel aus dem Pad verwendet werden und der Rest wird ergänzt, so dass aller gesagter Text vollständig in amara.org landet.


2. Schritt

Im zweiten Schritt auf amara.org werden die Untertitel grob abgestimmt. Nach dem zweiten Schritt wirst du nach dem Titel gefragt, gib hier bitte den Titel des Vortrags ein.


3. Schritt

Im dritten Schritt auf amara.org werden die Untertitel fein abgestimmt.


4. Schritt

Im vierten Schritt wird das Video mit den Untertiteln noch einmal betrachtet und letzte Ungereimtheiten werden beseitigt. Wenn du der erste bist der den Vortrag bearbeitet, lass ihn am besten am Ende auf "unvollständig" stehen. Derjenige der nach dir das ganze nochmal anschaut kann ihn dann als "vollständig" markieren. Bitte benutze auch die Kommentar-Funktion von amra.org um denjenigen nach dir zu sagen was noch zu tun ist oder was nicht mehr getan werden muss.


Übersetzen mit amara.org

Wenn der Vortrag in der Originalsprache untertitelt ist kann er übersetzt werden. Das geht auch mit amara.org sehr einfach und ist weit weniger aufwendig als die Untertitel selbst zu erstellen. Bitte erst damit anfangen wenn in den Kommentaren steht das die Untertitel der Originalsprache "reviewt" wurden und die Sprache als vollständig markiert ist. Sonst gibt es Probleme mit dem Editor wenn in der Orignalsprache noch etwas geändert wird.


Fertige Untertitel

Fertige Untertitel werden als *.srt-Dateien über den FTP-Server zur Verfügung gestellt, der Prozess dazu ist noch nicht ganz fertig.


Wie sehen gute Untertitel aus?

Kurzfassung:
Steuerzeichen: weniger ist mehr
Inhalt: wenn machbar dann 1:1


Das was ihr hier findet kommt einerseits von hier: http://www.ndr.de/fernsehen/zuschauerservice/untertitel/utstandards100.html und wurde andererseits mächtig diskutiert. Daran beteiligt: eine gehörlose Beraterin die Untertitel verwendet und eine Gebärdensprachdolmetscherin die selbst auch Untertitel erstellt.

Folgendes war unser gemeinsames Ergebnis:

  • bei Dialogen werden die Sprecher markiert. Volle Namensnennung nur bei der ersten Verwendung danach genügen eindeutige Abkürzungen. Ob ihr die "sie" oder "du "-Form verwendet bleibt euch überlassen, aber prinzipiell: desto kürzer desto besser!
    • Beispiel:
   Constanze Kurz: Willkommen! 
*Applaus*
Kurz: Schön, dass ihr da seid!
Frank Rieger: Auch von mir herzlich willkommen!
Rieger: ...
    • Beispiel (keine Nachnamen bekannt):
  Laura: Hallo Pünktchen! Hallo Anton! 
A: Hallo Laura, wie gehts?
P: Hallo!
L: Gut, danke!
  • Keine Klammern um Namen
  • bei Dialogen mit zwei Leuten kann es weiter vereinfacht werden:
    • Beispiel:
   - Hey alles klar? 
- Ja bei mir schon und bei dir?
- Alles in Butter
- Gut dann sehen wir uns morgen
  • Kürzungen sind erlaubt sollten aber soweit irgend möglich vermieden werden. "Ähs" und "öhs" und doppelte Wörter dürfen weg gelassen werden ausser sie sind für das Verständnis wichtig, z.B. für einen Witz.
  • Untertitel werden in direkter Rede verfasst, keine Anführungszeichen. Ausser es wird etwas zitiert.
  • Zahlen werden am besten in Ziffern geschrieben, denn das ist kürzer. Wenn es die Lesbarkeit enorm behindert können auch Worte verwendet werden. Z.B. bei den Zahlen von eins bis zwölf.
  • Geräusche werden mit "*" sichtbar gemacht, also z.B.
*Applaus*
*Gelächter*
*lautes Gelächter*
*Buh-Rufe*
*Unruhe im Saal*
*Handy klingelt*
  • falls du an einer Stelle in amara mit Absicht einen Zeilenumbruch willst kannst du Shift + Enter drücken
    • Beipsiel:
    Ja dann danke ich dir herzlich für deinen Vortrag (Zeilenumbruch) 
*tosender Applaus*
  • beim Fragen-Antworten Teil könnt ihr z .B. so verfahren: Benennt beim ersten auftreten den Engel mit "XY Engel:" und die Fragen als "Fragen:" und Antworten als "Antwort:" H"Audio:" "Signal:" "Herald:" und "F:" und "A:".
    • Beispiel:
Herald Engel: Wir begrüßen für diesen Talk Linus Torvalds, Richard Stallman, ... 
*Publikum tobt*
Herald: ... Bill Gates und Steve Jobs.
*verhaltener Applaus, murmeln*
Herald: Und nun viel Spaß mit dem Vortrag: "Wie sieht gute Software denn aus?"
Torvalds: Guten Abend.
*Applaus*
Stallman: Abend.
*Applaus*
Gates: Guten Abend.
*Applaus*
Jobs: Abend.
*Applaus*
Stallman: Software muss frei sein! Das ist oberstes Prinzip!
Gates: Und wovon sollen die Programmierer denn leben? Luft und Liebe?
Torvalds: Meine Software wird auf vielen Geräten eingesetzt und es werden Programmierer bezahlt, die diese Software dann auch erweitern, wenn diese auf neuen Geräten eingesetzt werden soll.
Jobs: Und was ist mit dem Design? Nur mit gutem Design wird Software auch verwendet!
Stallman: Auf einem Terminal will ich auch arbeiten können!
Gates: Benutzer wieder in die Text-Hölle zu schicken, nachdem sie grafische Oberflächen verwendet haben...
Jobs: Die IHR UNS geklaut habt! Da steht noch ein Gerichtsurteil aus!!
Stallman: Gute Konzepte werden nachgeahmt und weiterentwickelt, wie auch beim Code.
Torvalds: Das erinnert mich an die Codezeile, die aus Linux nach Windows übernommen wurde: "if KLAMMERAUF


FAQ

Ich bin in einem Vortrag und spreche die Vortragssprache gut und kann schnell tippen, wie kann ich mitmachen?
Beobachte den Twitter-Account www.twitter.com/c3subtitles dort kommen immer die aktuellen Ansagen und Pad-Adressen zum mitschreiben oder schaue auf diese Seite um den Link zum Pad zu finden.


Ich bin in einem Vortrag und spreche die Vortragssprache gut, kann aber nicht schnell tippen, wie kann ich mitmachen?
Du kannst das Pad trotzdem öffnen und korrigieren wenn du siehst das der Mitscheriber etwas verpasst hat.


Ich schaue den Vortrag von $irgendwo_mit_Internetanbindung an, wie kann ich mitmachen?
Mach das Pad auf und schaue ob du korrigieren kannst. Live mitschreiben wird nicht gehen – ausser du bist allein – denn das hat eine Verzögerung von ca. einer halben Minute. Dies ist auch sehr gut geeignet um fehlende Textstellen zu füllen. Dabei ist es eher von Vorteil, wenn die Verzögerung etwas größer ist, um nicht mit den live vor Ort Schreibenden zu kollidieren. Die Audio-only-Streams haben eine eher noch größere Verzögerung.


Ich habe den Vortrag weder live noch per Stream gesehen, kann ich trotzdem noch mitmachen?
Ja, die Plattform zum bearbeiten wird mit den entsprechenden Links veröffentlicht. Dort kann jeder bearbeiten.


Was muss ich überhaupt können um mitmachen zu können?
Tastatur bedienen, hören, Browser öffnen, klicken.


Ich bin in einem Vortrag, aber alle reservierten Sitze für die Mitschreiber sind schon belegt, was kann ich tun?
Du kannst von überall mitschreiben.


Ich traue mir das mitschreiben in der Sprache $Sprache nicht zu, könnte aber bestehende Untertitel übersetzen, wie geht das?
Wenn der Untertitel in der Orignalsprache erstellt ist können andere Sprachen erstellt werden, dann kannst du helfen.


Ich habe keinen Nerv/Geduld/Zeit mich länger als X Minuten damit zu beschäftigen, oder ich habe nur in kurzen Pausen Zeit, kann ich trotzdem mitmachen?
Das macht nichts, du kannst jederzeit auf „Save and Exit“ klicken und jemand anderes kann an dieser Stelle weiter arbeiten. Du kannst in den Kommentaren hinterlassen bis wo genau du gekommen bist.


Was ist mit anderen Sachen außer Sprache die man nur hören aber nicht sehen kann, wie Gelächter, Klatschen oder Buh-Rufe?
Siehe "Wie sehen gute Untertitel aus?"


Ich sitze in einem Vortrag und würde gerne mitschreiben, aber das WLAN ist gerade wieder tot, was kann ich tun?
Mache lokal eine Textdatei auf und schreibe dort mit, später kannst du es in das Pad kopieren.


Auf was muss ich bei der Untertitelerstellung achten, damit die Untertitel gut verwendbar sind?
Siehe: http://www.ndr.de/fernsehen/zuschauerservice/untertitel/utstandards100.html bzw. hier "Wie sehen gute Untertitel aus?"


Ich habe alle FAQ Fragen durch gelesen aber meine Frage ist trotzdem nicht dabei...
Dann kontaktiere mich: über Twitter: @c3subtitles per Mail: c3subtitles@privatdemail.net per eventphone leider nicht mehr.