Archive for März 2014

Source Code von MS-DOS 2.0 veröffentlicht

25 März 2014

Yuppiee! Der erste Schritt ist gemacht. Nach über 30 Jahren wird der Source Code von MS-DOS 2.0 veröffentlicht. Bis wir den Source Code von Windows 8.1 und nachfolgend sehen werden, wird es sicherlich nicht mehr ganz so lange dauern. http://www.heise.de/newsticker/meldung/Quelltexte-von-MS-DOS-und-Word-for-Windows-veroeffentlicht-2154723.html

Hier zum Source von MS-DOS: http://www.computerhistory.org/atchm/microsoft-ms-dos-early-source-code/, falls nicht wieder die Guru Meditation wegen Überlastung kommt.

MS-DOS 2.0 das war das Betriebssystem, welches damals auf den ersten IBM-XT-PCs lief, dem Nachfolger des ersten als solches benannten Personal Computer, dem IBM PC. Da gab es auch schon Festplatten mit 10MB und so, ach und die flexiblen Scheiben, die 5 1/4 Zoll großen, ähm – ah ja – Floppy Disks! So ein PC war damals richtig schwer und heute tragen wir um 100 ja sogar 1000fach leistungsfähigere Geräte in der Hosentasche. Wer das alte Feeling nochmal erleben möchte, hier der Link zum MS-DOS 2.0 Emulator im Browser: http://jsmachines.net/configs/pc/machines/5160/cga/256kb/demo/

Warum es bei Windows 8.1 keine 30 Jahre bis zur Source Code Veröffentlichung dauern wird? Na weil das .Net Framework 4.5.1 bereits in seiner reinsten Form einsehbar ist: http://referencesource.microsoft.com/. Auch sind weite Teile von ASP.NET bereits unter Open Source verfügbar.

Schließlich wird Microsoft irgendwann gezwungen sein allen Source Code zu veröffentlichen, da keiner mehr den ganzen Müll warten will, den die da über die Jahre angehäuft haben. Denen gehen ja jetzt schon die ganzen Techniker aus, die sich mit dem ganzen Zeugs beschäftigen wollen bzw. die da überhaupt noch durchblicken. Man sieht dies ganz deutlich in vielen Microsoft moderierten Foren. Was da teilweise für Antworten von MS-Mitarbeitern kommen. Oder wie oft fehlt es an technischen Beschreibungen in der Knowledge Base oder Technet. Alles klare Anzeichen, dass die letzten Jahre viel in die falsche Richtung lief. Aber die Cloud soll es ja retten. Mal sehen, was nächste Woche auf der Build der neue Oberindianer von sich gibt.

xn--bcher-kva.de oder was hat das mit Bücher.de zu tun? Die Geschichte von Punycode bzw. IDN, also Internationale Domain Namen.

1 März 2014

Seit einigen Jahren ist es bereits möglich Domainnamen mit Umlauten wie äöü zu erhalten. Fast jeder hat sich seither damit aber zurückgehalten, weil viele Programme damit nicht umgehen können.

Aber in letzter Zeit scheinen es mehr Domains zu werden und wenn es nur darum geht, diese zusätzlich zu benutzen, um am Ende wieder auf die Hauptdomain weiterzuleiten. Wer zum heutigen Tag, als dieser Blogeintrag geschrieben wurde, www.bücher.de eingibt, der landet bei www.buecher.de. Soweit ist alles paletti.

Wer nun aber hin und wieder irgendwelche LOG-Dateien auswertet oder untersucht, bzw. mysteriöse Problemfälle zu ergründen versucht, der stolpert irgendwann über das Kürzel xn--.

Die Erklärung dafür ist recht simpel. Die komplette Internetinfrastruktur stammt aus der 8 bzw. noch 7-Bit Computersteinzeit. Als man die DNS-Infrastruktur aufbaute, gab es bekanntlich ja nur die USA und die kennen nun mal nur A-Z und die Zahlen von 0-9. Als man Ende der 80iger Jahre Unicode einführte, war es aber bereits zu spät alle DNS-Systeme umzustellen und keiner wusste, ob Unicode sich jemals durchsetzen würde, denn schließlich verschlang es Unmengen an Bytes.

Wenn man heute das Internet nochmal neu entwickeln könnte, würde man natürlich von Anbeginn Unicode verwenden. Aber dafür ist es zu spät. Also haben clevere Leute sich mit einem Kniff beholfen. Es entstand der sogenannte Punycode der im RFC3492 spezifiziert wurde, ein Algorithmus, welcher dafür sorgt dass zwischen ASCII und Unicode Zeichen umgesetzt werden können, ohne dass Informationen verloren gehen. Damit man weiß, dass es sich um einen Punycode behandelten Buchstaben handelt, wird einfach ein Marker davor gesetzt. Der Marker ist eben dieses Kürzel xn--. In RFC3490 als ACE prefix bezeichnet. Da dieses Kürzel sonst nicht verwendet wird und vorkam, konnte man immer eindeutig sagen, wann die ASCII-Zeichen in Unicode gewandelt werden müssen. RFC3490 betitelt mit “Internationalizing of Domain Names for Applications” führte zu der Abkürzung IDNA. Da das RFC 2003 veröffentlicht wurde, sprach man später von IDNA2003. Im Jahr 2008 entdeckte man auf einmal, dass es auch Sprachen gibt, welche von rechts nach links geschrieben werden und es gab noch andere Ungereimtheiten. Diese wurden in RFC5890 behandelt, welches dann als IDNA2008 bezeichnet wurde.

So also zurück wieder zu www.bücher.de. Wer nun wissen möchte, wie bücher.de konvertiert aussieht, der kann ganz einfach Onlinedienste dafür verwenden, z. B. http://www.charset.org/punycode.php?encoded=xn--bcher-kva.de&decode=Punycode+to+normal+text. Bei

Bücher.de

kommt also

xn--bcher-kva.de

bei raus. Interessant ist auch die Variante mit Subdomain http://www.charset.org/punycode.php?decoded=www.b%C3%BCcher.de&encode=Normal+text+to+Punycode#results:

www.bücher.de

wird zu

http://www.xn--bcher-kva.de

Es wird also einfach das www. davor beibehalten.

Zu welchen Verwicklungen diese Dinge führen können, werden wir in nächster Zeit im einen oder anderen Blogbeitrag wieder finden.