Die Suche ergab 29 Treffer

von Kai Borrmann
Freitag 30. Januar 2009, 13:01
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Schlüsselwörter

In dem Softwarepacket befindet sich auch eine Datei namens "Rootquran", die es erlaubt,
nach Bedeutungsfeldern zu suchen, die an eine arabische Konsonantenwurzel geknüpft sind.

Hier mal eine Auswahl von sozial relevanten Schlüsselwörtern:



&(dh)b (strafen, trinkbar)
&bd (als Sklave dienen ...
von Kai Borrmann
Freitag 16. Januar 2009, 16:27
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Nachdem im Juli 2008 eine erste funktionsfähige Webseite veröffentlicht wurde, auf der durch das Anklicken des Textes der Koran nach beliebigen Wörtern durchsucht werden kann, bietet die Arbeitsgruppe „Qibla“ nun ein kostenloses Softwarepaket an, welches zahlreiche Verbesserungen enthält ...
von Kai Borrmann
Donnerstag 24. Juli 2008, 17:55
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Unserer Seite

http://qibla.appspot.com haben wir jetzt auch das arabische Original
und eine deutsche Übersetzung hinzugefügt.

Gruß, K.B.
von Kai Borrmann
Dienstag 24. Juni 2008, 10:05
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Die Firma TextWise bietet sogenannte "Semantic Signatures" an.

Auf ihrer Webseite kann man Text eingeben,
der dann durch quantitative Methoden analysiert wird,
so daß dessen Ähnlichkeit mit bereits bestehenden Texten ermittelt werden kann:

http://www.semantichacker.com/

Für englische Passagen ...
von Kai Borrmann
Donnerstag 12. Juni 2008, 19:57
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Die Sache ist jetzt weiter gediehen.

Mit "Surfin' the Qur'an" lassen sich eine englische Übersetzung

und eine Transkription miteinander vergleichen. Viel Spaß!

http://qibla.appspot.com/
von Kai Borrmann
Mittwoch 14. Mai 2008, 23:28
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Auf der folgenden Seite habe ich mal die Ausgangsüberlegungen und einige der bisherigen Ergebnisse zusammengebracht:

http://www.raunaq.info-a.googlepages.co ... ernet.html

Mein Dank an alle, die dabei geholfen haben!
von Kai Borrmann
Dienstag 13. Mai 2008, 03:45
Forum: Allgemeine Fragen
Thema: möglichkeit für warscheinlichstes Suchergebnis
Antworten: 30
Zugriffe: 6808

Da der Link zu dem Soundex Modul nicht mehr aktuell ist gibts hier einen Link zu einer compilierten Win32 Version.

www.python-forum.de/downloads/Levenshtein.pyd

Gruß
Damaskus

Danke für den Tipp.

Nun habe ich sie in das Verzeichnis C:\Python25\Lib\site-packages runtergeladen.

Wie bekomme ...
von Kai Borrmann
Montag 12. Mai 2008, 16:04
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Der Korantext liegt nun in einer Datei vor, in welcher jedem Satz die Nummer der Sure und der Ayat, also von Kapitel und Vers, vorangestellt ist. Ein Ausschnitt:


[71:1] #.)inn%-a #.)arsaln%-a n%-u%..han #.)il%-a qawmih%-i #.)an #.)an%--dir qawmaka min qabli #.)an ya#.)tiyahum #.(a%--d%-abun ...
von Kai Borrmann
Freitag 9. Mai 2008, 15:46
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Über den ISO-Standard zur Topic Map haben wir uns noch keine verschärften Gedanken gemacht.

"Topic map" ist zunächst mal ein Bezugsrahmen, über den auf dem folgenden, für dieses Projekt gegründeten, Blog auch diskutiert werden kann:

http://www.raunaq.info-a.googlepages.com/

Über Besucher ...
von Kai Borrmann
Samstag 12. April 2008, 11:13
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Hier ist ein erster Versuch der Visualisierung zu finden:

http://user.baden-online.de/~pjanssen/t ... index.html
von Kai Borrmann
Dienstag 8. April 2008, 09:29
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Mit dem folgenden Beispiel kann man eine Grafik erzeugen,
die erkennbar macht, daß die Suren des Koran nicht, wie oft
zu lesen, nach absteigender Länge sortiert sind.

Dies stimmt generell, aber nicht durchweg; manchmal folgen
längere auf kürzere.





from Tkinter import *
root = Tk ...
von Kai Borrmann
Donnerstag 3. April 2008, 20:03
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

EyDu hat geschrieben:Nur mal der Interesse halber: Der selbe Kai Borrmann dieses FAZ Artikels?
Ja, dieser Artikel der TAZ (nicht FAZ) erwähnt auch mich. Es ging seinerzeit aber nicht um Python. :)
von Kai Borrmann
Donnerstag 3. April 2008, 19:12
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Mal ein Beispiel für eine KWIC-Analyse:

Der Kontext der ersten fünf Surennamen

&alay-him wa-laa l-Daall-iina suurat-u l-baqarat-i
&alaa l-qawm-i l-kaafir-iina suurat-u 'aal-i
llaah-a la&alla-kum tufliH-uuna suurat-u l-nisaa'-i
bi-kull-i (sh)ay'-in &aliim-un suurat-u l-maa'idat-i
kull-i (sh ...
von Kai Borrmann
Mittwoch 2. April 2008, 10:14
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Ein Beispiel für die Darstellung des Partikels "kallaa" durch eine KWIC "Key Word in Context" Analyse.

text = open("C:\Koran Umschrift.txt","r").read().split()

kwicdict = {}

ngrams = [text[i:i+6] for i in range(len(text)-5)]

for n in ngrams:
if n[2] not in kwicdict:
kwicdict[n[2]] = [n ...
von Kai Borrmann
Montag 31. März 2008, 13:49
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Nach einigen Umwegen der Bearbeitung folgt hier die geordnete Menge ("sorted set") der in der Ausgangsdatei "qurout.txt" als Eigennamen "ProperName" gekennzeichneten Wörter.

Es ist zu beachten, daß diese Liste einige Fehler enthält: Der Brokat, "istabraq", etwa kann im Koran kein Eigenname sein ...
von Kai Borrmann
Samstag 29. März 2008, 20:35
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Die oben dargestellte Möglichkeit, Wörter abzuzählen, läßt sich durch die Bedingung if len(word) auf bestimmte Wortlängen einschränken.

for word, count in sorted(histogram.iteritems()):
if len(word) == 3:
print count, word,
print

Es folgt die Auflistung aller Wörter, die drei Zeichen lang ...
von Kai Borrmann
Samstag 29. März 2008, 12:24
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Setzt man in der Kommandozeile eine Zuordnung zwischen der lateinischen Buchstabenfolge „Allah“
und deren Äquivalent im Unicodesystem, so läßt sich damit im Folgenden operieren:

>>> Allah = u" \uFDF2 "
>>> print Allah
von Kai Borrmann
Mittwoch 26. März 2008, 11:18
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Der automatisierten morphologischen Analyse des Korans gelingt es bisher,

ca. 70 % aller Worte eindeutig einzuordnen.

http://cs.haifa.ac.il/~shuly/publications/quran.pdf



>>> sequenz = open("C:\Koran mit Dubletten.txt","r").read()
>>> text = sequenz.split()
>>> len(text)
99004
>>> 99004-78464 ...
von Kai Borrmann
Dienstag 25. März 2008, 15:38
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Durch "regular expressions" kann man vom konkreten Wort
abstrahieren und nach bestimmten Wortformen suchen.

Möchte man alle Worte der Form "fa'ala" finden, dann
ist dies eine Folge von Konsonanten, also nicht "^" a, i oder u
(andere kennt das Arabische nicht) und eben den Vokalen.


import re ...
von Kai Borrmann
Montag 24. März 2008, 19:43
Forum: Ideen
Thema: Der Koran als Topic Map
Antworten: 44
Zugriffe: 31439

Blackjack,

das Schließen der Dateien werde ich nach Möglichkeit beherzigen und dein Beispiel habe ich erfolgreich getestet.

Das Stichwort "Histogramm" ist sicher für die Map sehr wichtig.

Untenstehend noch ein paar Zählungen, um mal zu zeigen, was
man alles so machen kann.






>>> sequenz ...