"Programmier-Service"

Alles, was nicht direkt mit Python-Problemen zu tun hat. Dies ist auch der perfekte Platz für Jobangebote.
kitkat
User
Beiträge: 7
Registriert: Montag 18. August 2008, 20:07

"Programmier-Service"

Beitragvon kitkat » Montag 18. August 2008, 20:30

Hallo!

Ich weiß, daß diese Frage wahrscheinlich hochgradig peinlich ist, aber: wo kann man sich denn Python-Skripte einigermaßen günstig schreiben <b>lassen</b>?

Folgendes Problem: ich habe im Rahmen eines größeren Projekts an der Uni etliche Meßreihen durchgeführt, bei denen das Meßgerät jeweils eine furchtbar unübersichtliche Datei als Ergbenis ausspuckt.

Für die schriftliche Auswertung müssen aus dieser Datei jeweils etliche Einträge, die zwar an immer verschiedenen Stellen – aber doch unter systematischen Kategorie-Namen – in dieser Datei stehen, in tabellarischer Form angegeben werden. Nachdem das händische raussuchen unmöglich lange dauert, wäre hier ein Python-Skript von Vorteil, dessen Aufgabe sich mit "Aus einer Vielzahl von Dateien die immer wieder gleichen Einträge raussuchen und diese in tabellarischer Form ausgeben" zusammenfassen läßt.

Mit diesem Problem scheine ich nicht ganz alleine zu sein, wie man an ein paar Einträgen hier im Forum der letzten Zeit erkennen kann.

Ich selber kann in Python nur sehr wenig programmieren, kann aber in bestehenden Programmen selber ein wenig herumschreiben. Ich habe mal versucht (oder genauer gesagt: gefragt), so ein Programm von einem fertigen Programmierer schreiben zu lassen, aufgrund der teils vierstelligen (!) Preise – die für einen wissenschaftlichen Angestellten einfach nicht zu stemmen sind – wurde aber nix daraus. Leider kenne ich auch keine Informatiker oder Studenten aus diesem Bereich.

Hat irgendjemand einen Tip für dieses Problem (z.B. Anlaufstellen, die so etwas günstig schreiben könnten)?
audax
User
Beiträge: 830
Registriert: Mittwoch 19. Dezember 2007, 10:38

Beitragvon audax » Montag 18. August 2008, 20:52

Hier finden sich ordentliche Leute dafür ;)

Wenns nicht sofort fertig sein soll würde ich mich meine Arbeitskraft anbieten, ich mag sowas :D
Ich hätte aber erst in ~2 Wochen wieder Zeit, vielleicht auch etwas früher.

Data-Crunching ist toll!
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

"an der Uni etliche Meßreihen"

Beitragvon Sr4l » Montag 18. August 2008, 20:56

Kannst du mir mal ein Beispiel für die Datei geben?
Und rein interessehalber aus welchem Bereich stammen die Daten?

Wenn ich mir die verwendeten Technologien selber aussuchen kann und die Daten einigermaßen zu parsen sind mache ich das auch mal als Wochenendarbeit.


mfG Lars
Benutzeravatar
veers
User
Beiträge: 1219
Registriert: Mittwoch 28. Februar 2007, 20:01
Wohnort: Zürich (CH)
Kontaktdaten:

Beitragvon veers » Dienstag 19. August 2008, 08:22

Im Vierstelligen Bereich bist du eigentlich sofort wenn du das Professionell machst ;) Billiger bekommst du es vermutlich von Studenten etc. Am besten postest du hier mal im Offtopic ein etwas konkreteres Angebot ;)
My Website - 29a.ch
"If privacy is outlawed, only outlaws will have privacy." - Phil Zimmermann
Benutzeravatar
Leonidas
Administrator
Beiträge: 16023
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Beitragvon Leonidas » Dienstag 19. August 2008, 08:23

veers hat geschrieben:Am besten postest du hier mal im Offtopic ein etwas konkreteres Angebot ;)

Na jetzt ist es auch in Offtopic, da wo so etwas eher Platz hat.
My god, it's full of CARs! | Leonidasvoice vs Modvoice
kitkat
User
Beiträge: 7
Registriert: Montag 18. August 2008, 20:07

Beitragvon kitkat » Dienstag 19. August 2008, 11:52

Es handelt sich dabei um Daten aus dem Bereich der Röntgenstrukturanalyse. Es handelt sich dabei um sogenannte "cif"-files (_c_rystallographic _i_nformation _f_ile), die einer bestimmten Syntax bei der Eingabe folgen.

Hier mal ein Beispiel für eine der eher etwas übersichtlicheren Dateien für "Verbindung A" (_nicht_ erschrecken!):


SIEHE paste.pocoo.org (unten)



Ich habe dieses File jetzt schon mal um ein paar wirklich unnötige Einträge erleichtert, trotzdem sieht man – glaube ich – ganz gut das Problem dabei, wenn man hier von Hand was raussuchen muß.

Wünschenswert wäre es nun, wenn man aus einer großen Zahl solcher Dateien die immer gleichen Informationen rausholen könnte. Z.B. muß bei jeder Datei einmal der hinter dem Punkt "_chemical_formula_moiety" stehende Eintrag "'C4 H4 O2'" rausgefischt werden, dann der hinter dem Punkt "_chemical_formula_weight" stehende Eintrag "84.07", dann der hinter dem Punkt "_symmetry_Int_Tables_number" stehende Eintrag "19" usw.

Dabei sieht man aber schon das erste Problem: manchmal besteht die "zu fischende" Information aus einem einzigen Wort, manchmal besteht sie aus einem Ausdruck in Hochkommata, manchmal besteht sie aus einem Eintrag zwischen Strichpunkten. Mittels eines Tools (PyCIFRW) kann man diese Besonderheiten der Dateneingabe aber glattbügeln. Das Tool gibt es unter http://anbf2.kek.jp/CIF/, die Anleitung dazu unter http://anbf2.kek.jp/CIF/manual.html.


Toll wäre schlußendlich dann eine für Latex-Nutzer verwendbare Ausgabe der sechs cif-files für die Verbindungen A–F in diesem Stil:

& Verbindung A & Verbindung B & Verbindung C\\

Summenformel & \ce{ C6H12O6} & \ce{C3H8O} & \ce{C6H6} \\
Molmasse & 123.58 & 678.35 & 547.96 \\
RG-Nummer & 19 & 14 & 15\\


& Verbindung D & Verbindung E & Verbindung F\\

Summenformel & \ce{ H2O} & \ce{MnSO4} & \ce{CaH2} \\
Molmasse & 822.01 & 104.58 & 66.69\\
RG-Nummer & 52 & 18 & 10\\



Kriegt man soetwas mit Python hin? Faktisch bräuchte ich [b]nur einen Einstieg[/b] in so ein Programm (evtl. vielleicht sogar nur mal anhand dieser drei genannten Beispiele aus dem angehängten File), da ich ohnehin – je nach Wunsch des Betreuers des Projekts – den Tabellen-Aufbau modifizieren muß.
Zuletzt geändert von kitkat am Dienstag 19. August 2008, 16:38, insgesamt 1-mal geändert.
audax
User
Beiträge: 830
Registriert: Mittwoch 19. Dezember 2007, 10:38

Beitragvon audax » Dienstag 19. August 2008, 13:11

Lad die Testdatei mal woanders hoch, beim Pasten ins Forum ist da wohl was schief gegangen, der findet nicht alle Werte.
Kannst die z.B. bei paste.pocoo.org hochladen.

Sollte das Modul dann funktionieren, ist das eine ganz arg schnelle Angelegenheit ;)
kitkat
User
Beiträge: 7
Registriert: Montag 18. August 2008, 20:07

Beitragvon kitkat » Dienstag 19. August 2008, 13:38

:shock: :shock: :shock: :shock:


...das geht [b]SO[/b] fix???? :shock: :shock: :shock:



...ist mir jetzt echt peinlich :oops:


habe den Eintrag der Datei bei paste.pocoo.org hochgeladen (Paste #82687)
Benutzeravatar
cofi
Moderator
Beiträge: 4432
Registriert: Sonntag 30. März 2008, 04:16
Wohnort: RGFybXN0YWR0

Beitragvon cofi » Dienstag 19. August 2008, 15:56

kitkat hat geschrieben:habe den Eintrag der Datei bei paste.pocoo.org hochgeladen (Paste #82687)


Dann bearbeite bitte deinen Post: Lösche den Roman und füge stattdessen den Link ein ... Antworten auf den Thread wird unmöglich.
kitkat
User
Beiträge: 7
Registriert: Montag 18. August 2008, 20:07

Beitragvon kitkat » Dienstag 19. August 2008, 16:29

OK, aber wie macht man das genau?

Habe mit http://paste.pocoo.org/ bisher noch nie gearbeitet...


Kann die Datei notfalls auch per mail verschicken, liegt halt nur hier lokal am PC.
CM
User
Beiträge: 2464
Registriert: Sonntag 29. August 2004, 19:47
Kontaktdaten:

Beitragvon CM » Dienstag 19. August 2008, 16:36

In dem man einen Link auf das Pastebin postet, was hiermit geschehen ist. Den Roman in Deinem Threadbeitrag mußt Du schon selber löschen.

Was mich interessiert: Wozu braucht man das? Es gibt doch eine ganze Reihe von Programmen, die CIF und mmCIF verstehen.

Gruß,
Christian
kitkat
User
Beiträge: 7
Registriert: Montag 18. August 2008, 20:07

Beitragvon kitkat » Dienstag 19. August 2008, 16:45

Das Verstehen von cif-files an sich ist auch gar nicht das Problem, für einzelne Tabellen gibt es sowas sicher, nur geht es hier in meinem Fall um mehrere hundert dieser cif-files, die in Tabellen gepreßt werden sollen.

Das einzelne Erstellen, Nachbearbeiten und dann Einfügen aller dieser Tabellen ist einfach furchtbar zeitaufwendig, multipliziert mit der Anzahl der cif-files kann man sich vorstellen, wieviel Zeit dann nur für diese einen Schritt der schriftlichen Projektabfassung dafür draufginge.

Außerdem wechseln die Vorstellungen des Betreuers darüber, wie diese Tabellen aussehen sollten, leider sehr häufig, so daß fertige (evtl. ja sogar kommerziell erhältliche?) Programme hierfür mit großer Wahrscheinlichkeit einfach zu unflexibel sind.
CM
User
Beiträge: 2464
Registriert: Sonntag 29. August 2004, 19:47
Kontaktdaten:

Beitragvon CM » Dienstag 19. August 2008, 16:50

Aha. Ja, das mit den Betreuern verstehe ich - leider - gut.

Nun, in so einem Fall bietet sich Python wahrscheinlich wirklich an.

Viel Erfolg!
Benutzeravatar
veers
User
Beiträge: 1219
Registriert: Mittwoch 28. Februar 2007, 20:01
Wohnort: Zürich (CH)
Kontaktdaten:

Beitragvon veers » Dienstag 19. August 2008, 17:50

Das Projekt würde dir doch einen guten Einstieg in die Python Programmierung geben. Mit dem Tutorial und etwas Hilfe aus dem Forum müsstest du das Problemlos selber schreiben können. ;)
My Website - 29a.ch

"If privacy is outlawed, only outlaws will have privacy." - Phil Zimmermann
audax
User
Beiträge: 830
Registriert: Mittwoch 19. Dezember 2007, 10:38

Beitragvon audax » Dienstag 19. August 2008, 17:52

Jup, jetzt funzt alles :]

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder