Re: Νέα υποσελίδα: Βιβλιοθήκη
Δημοσιεύτηκε: 14 Μάιος 2020 11:05 pm
Το τσέκαρα το pdf που άφησες προηγουμένως. Σ' εμένα η εύρεση όρων σε Ελληνικά και Αγγλικά λειτουργεί μια χαρά. Δεν ξέρω αν θες να δω και κάτι άλλο.
Δεν πειράζει, Σωκράτη. Δεν έγινε τίποτα, σιγά το παίδεμα.
Το OCR δεν χρειάζεται να το πειράζεις, αυτό προσπαθώ να εξηγήσω. Γιατί αυτό που κάνεις, αν καταλαβαίνω καλά, είναι να λες στο πρόγραμμα να πραγματοποιήσει οπτική αναγνώριση χαρακτήρων ενώ έχει ήδη γίνει από μένα πριν το ανεβάσουμε. Εσύ αν θες να ψάξεις έναν όρο, απλώς αναζητάς με Edit/Find τίποτε άλλο. Αν όμως έψαχνες σε ένα άλλο pdf και δεν σου έβρισκε τίποτα, τότε θα μπορούσες να κάνεις το OCR γιατί θα σήμαινε ότι δεν έχει ήδη γίνει. Και μετά θα μπορούσες να κάνεις την αντίστοιχη αναζήτηση. Αυτό π.χ. μπορείς να το κάνεις για τα Ελληνικά στα συμπληρώματα Victor. Αφού έχεις το Acrobat Pro με το οποίο γίνεται μια χαρά αυτή δουλειά, κάνε ένα OCR για τα Ελληνικά εφόσον σου χρειάζεται κι έτσι θα μπορείς να βρίσκεις ελληνικούς όρους σε αυτά το pdf. Καταλαβαίνω αυτό που λες με τα σύμβολα και τα κουτάκια, αλλά γιατί θες να παιδεύεσαι; Δεν χρειάζεται να αλλάξεις κάτι στο pdf ούτε να αναζητάς με ακατανόητα σύμβολα. Για το Parlez moi, η αναζήτηση βρίσκει αποτέλεσμα γιατί όπως είπα στο προηγούμενο μήνυμα, το πρόγραμμα κοιτάει να βρει λατινικούς χαρακτήρες που χρησιμοποιεί η αγγλική γλώσσα. Δεν διαβάζει λέξεις. Έτσι θα σου βρει οτιδήποτε έχει π.χ. τα σύμφωνα p,r,l,z,m και τα φωνήεντα a,e,o,i γιατί είναι χαρακτήρες της αγγλικής γλώσσας (αλλά και της γαλλικής). Αν εσύ τώρα έκανες αναζήτηση για è, é, ê, πιθανότατα να μην σου επέστρεφε αποτελέσματα αφού δεν είναι χαρακτήρες που συναντώνται στην Αγγλική.socrates έγραψε: ↑15 Μάιος 2020 06:11 am1 Άφησα το OCR στα γαλλικά επίτηδες, γιατί πρόσεξα ένα τραγούδι με τίτλο "Parlez moi d' Amour", με σκοπό να το αναζητήσω. Ξαναέκανα το OCR ελληνικά και αντέγραψα τον τίτλο όπως είναι στο έγγραφο και τον επικόλλησα στην αναζήτηση όπου εμφανίζεται σαν (Parlez Π1Οi d'AΠ1our). Δεν καταλαβαίνω την αλλαγή στις λέξεις "moi" και "Amour" αλλά έλαβα μήνυμα από το adobe ότι ένα internal error συνέβη στην αντιγραφή, ωστόσο η αναζήτηση (Parlez Π1Οi d'AΠ1our) βρίσκει τον τίτλο, αλλά αν επικολλήσω το σωστό τίτλο "Parlez moi d' Amour" δεν τον βρίσκει. Ξανα-άλλαξα το OCR στα αγγλικά και με "Parlez moi d' Amour" η αναζήτηση δεν βρίσκει τίποτα, αλλά αν σβήσω τις άλλες λέξεις και αφήσω μόνο "Parlez" τότε βρίσκει το τραγούδι και στις δύο περιπτώσεις όπου ο τίτλος είναι παρών. Αλλά εδώ αν αναζητήσω με (Parlez Π1Οi d'AΠ1our) δεν βρίσκει τίποτα, και μου φαίνεται λογικό αυτό γιατί το OCR είναι τώρα στα αγγλικά. (?)
Κατάλαβα τι γίνεται αλλά πολύ τα μπερδεύεις. Νομίζω πως δεν είναι χρήσιμα σε κάτι όλα αυτά. Και αυτό το τελευταίο με τα σύμβολα της μουσικής γραφής δεν μπορώ να βρω τι ιδιαίτερη εφαρμογή θα μπορούσε να έχει για να μας ωφελήσει. Να ψάξουμε δηλαδή για συγκεκριμένα σύμβολα σε παλιές χειρόγραφες παρτιτούρες; Γιατί; Άσε που δεν θα γινόταν αυτό γιατί το χειρόγραφο σύμβολο πιθανότατα δεν θα το έπιανε η αναζήτηση (ή θα το έβρισκε μια στο τόσο, άρα δεν θα είχε συνέπεια). Ή μήπως έχεις κάτι άλλο κατά νου;socrates έγραψε: ↑15 Μάιος 2020 06:11 am2 Άνοιξα ένα pdf που μου φαίνεται κάπως πιο δύσκολο για ανάγνωση/οπτική αναγνώριση-το ανεβάζω συνημμένο. Είναι ένα 4σέλιδο έγγραφο που δίνει σε unicode όλα τα αρχαία ελληνικά μουσικά σύμβολα. Εδώ δεν μου δίνει επιλογές να αλλάξω το OCR του συγκεκριμένου αρχείου-η ευκολία εμφανίζεται απενεργοποιημένη. Πήγα στη δεύτερη σελίδα του εγγράφου και αντέγραψα το δεύτερο σύμβολο της πέμπτης σειράς που μοιάζει σαν ένα κεφαλαίο "Γ" αλλά σε mirror form (βλέπει προς τα πίσω). Όταν το τοποθετώ στην αναζήτηση δεν εμφανίζεται το σύμβολο αυτό καθαυτό αλλά το τετραγωνίδιο που το περιέχει, αλλά κάνω αναζήτηση και με πηγαίνει στο συγκεκριμένο σύμβολο. Κάνω το ίδιο με διάφορα σύμβολα, αντιγράφω και επικολλώ στην αναζήτηση, πάντα εμφανίζεται ένα πανομοιότυπο ορθογώνιο σχήμα, ποτέ το unicode σύμβολο, αλλά η αναζήτηση με πάει πάντα στο συγκεκριμένο σύμβολο που αντέγραψα, όπου υπάρχει στο έγγραφό μου και όχι σε άλλα σύμβολα. Δεν είμαι σίγουρος για το τι να συμπεράνω απ' αυτό. Το acrobat παρ' όλο που δεν εμφανίζει το σύμβολο όταν το επικολλώ, ωστόσο το αναγνωρίζει σαν συγκεκριμένο και το διαφοροποιεί από τα υπόλοιπα, και έτσι με πάει στις περιπτώσεις όπου αυτό υπάρχει μες το έγγραφο. (?)
Στην παρούσα περίπτωση μου φαίνεται πως αυτό το έγγραφο unicode έχει μουσικολογική πρακτική αξία αν θα μπορούσε να τροποποιηθεί/βελτιωθεί για τη χρήση
πρακτικών μουσικών. Εννοώ αν θα μπορούσαμε κατά κάποιο τρόπο να συνδυάσουμε όλα τα σύμβολα με τα αντίστοιχα της σύγχρονης μουσικής γραφής τους στο πεντάγραμμο και να τα ενώσουμε σε ένα PDF. Μπορεί να το ψάξω στο μέλλον αυτό.
Για σχετικά με το ρεμπέτικο ντοκουμέντα που τυχαίνει να έχω και θα ανεβάσω σιγά σιγά έχω δει ότι μας χρειάζονται Ελληνικά (πολυτονικό ή/και μονοτονικό), Αγγλικά, Γαλλικά και πιθανώς Γερμανικά σε κάποια λίγα. Αλλά ανάλογα με το ντοκουμέντο ρυθμίζεται και το OCR, δεν είναι κάτι δύσκολο ούτε χρειάζεται ιδιαίτερη προετοιμασία.