Hey Leute
Ich bastel seit 3 - 4 Tagen, in meiner Freizeit auf arbeit, an nem OCR.
Das Script erkennt die Zeichen und matcht sie Punkt für Punkt gegen diverse Matrizen.
Das Matching ist sehr simpel und prüft einfach nur relational den Punkt (x, y) und das Umfeld in der Matrix.
Wenn eine Übereinstimmung auf einen der Punkte statt findet wird dieser mitgezählt.
Die Matrix die am Ende die meisten Übereinstimmungen hat gewinnt das Rennen.
Damit matche ich ca 60% - 70% korrekt.
Jetzt zum Problem.
Charaktäre wie I oder ein kleines L haben eine grade Matrix ohne leere Punkte.
Somit matchen diese immer.
Charaktäre die mehr Punkte zum Matchen haben sind natürlich auch ein Problem.
Z.B. der Buchstabe C wird eher auf ein Q passen da es dort mehr zu matchen gibt.
Natürlich berechne ich das prozentuale Verhältnis zu übereinstimmenden Punkten und maximal zu treffenden Punkten.
Das reicht aber noch nicht.
Ich überlege wie man am besten folgende Variablen einbeziehen kann.
- Maximal zu erreichende Punktzahl in einer Matrix
- Maximale Anzahl an überinstimmenden Punkten
- Übereinstimmende Punkte
- Erreichte Punktzahl in der Matrix
- Anzahl der zu prüfenden Punkte
Jetzt hab ich an euch ein paar fragen.
1. Meint ihr ein Service auf Stagetwo, wo man ein Captcha hinsenden kann und die Lösung bekommt, würde etwas bringen?
2. Würde euch ein Artikel über das Thema interessieren?
3. Habt ihr noch eine Idee wie man das Matching unter einbezug der Variablen noch verbessern kann? (Möglicht in weniger als 3 if's^^)
Danke im Vorraus für eure Meinung und Unterstützung.
Gruß Sick^