Νέα υποσελίδα: Βιβλιοθήκη

Message
Συγγραφέας
Άβαταρ μέλους
peloponnisios
More than 100 posts user
Δημοσιεύσεις: 147
Εγγραφή: 14 Αύγ 2012 03:38 am

Re: Νέα υποσελίδα: Βιβλιοθήκη

#15 Δημοσίευση από peloponnisios »

Το τσέκαρα το pdf που άφησες προηγουμένως. Σ' εμένα η εύρεση όρων σε Ελληνικά και Αγγλικά λειτουργεί μια χαρά. Δεν ξέρω αν θες να δω και κάτι άλλο.

Άβαταρ μέλους
socrates
More than 150 posts user.
Δημοσιεύσεις: 436
Εγγραφή: 21 Οκτ 2006 11:31 pm
Τοποθεσία: the other side of nowhere

Re: Νέα υποσελίδα: Βιβλιοθήκη

#16 Δημοσίευση από socrates »

Συγνώμη Κώστα, μάλλον σε παίδεψα πολύ και χωρίς λόγο γιατί τα δέντρα μου έκρυβαν το δάσος που λένε. Ξανάνοιξα το ORTHOPHONIC αρχείο και όντως το Acrobat το διαβάζει και στις δύο γλώσσες. Το είχα καταλάβει λάθος εξ αρχής, π.χ. Αναζητούσα "Βέμπο" και έγραφα "Vempo or Vembo" με λατινικούς χαρακτήρες και φυσικά το πρόγραμμα δεν εύρισκε τίποτα γιατί δεν υπάρχει τέτοια οπτική οντότητα μέσα στο αρχείο, υπάρχει μόνο "Βέμπο" την οποία βρίσκει παντού όπου υπάρχει.
Προσπαθώ να καταλάβω κάποιες λεπτότερες διαφορές στους τρόπους αναζητήσεως-μερικές παρατηρήσεις για όταν έχεις καιρό να μου πείς αν συμφωνείς:

1 Άφησα το OCR στα γαλλικά επίτηδες, γιατί πρόσεξα ένα τραγούδι με τίτλο "Parlez moi d' Amour", με σκοπό να το αναζητήσω. Ξαναέκανα το OCR ελληνικά και αντέγραψα τον τίτλο όπως είναι στο έγγραφο και τον επικόλλησα στην αναζήτηση όπου εμφανίζεται σαν (Parlez Π1Οi d'AΠ1our). Δεν καταλαβαίνω την αλλαγή στις λέξεις "moi" και "Amour" αλλά έλαβα μήνυμα από το adobe ότι ένα internal error συνέβη στην αντιγραφή, ωστόσο η αναζήτηση (Parlez Π1Οi d'AΠ1our) βρίσκει τον τίτλο, αλλά αν επικολλήσω το σωστό τίτλο "Parlez moi d' Amour" δεν τον βρίσκει. Ξανα-άλλαξα το OCR στα αγγλικά και με "Parlez moi d' Amour" η αναζήτηση δεν βρίσκει τίποτα, αλλά αν σβήσω τις άλλες λέξεις και αφήσω μόνο "Parlez" τότε βρίσκει το τραγούδι και στις δύο περιπτώσεις όπου ο τίτλος είναι παρών. Αλλά εδώ αν αναζητήσω με (Parlez Π1Οi d'AΠ1our) δεν βρίσκει τίποτα, και μου φαίνεται λογικό αυτό γιατί το OCR είναι τώρα στα αγγλικά. (?)

2 Άνοιξα ένα pdf που μου φαίνεται κάπως πιο δύσκολο για ανάγνωση/οπτική αναγνώριση-το ανεβάζω συνημμένο. Είναι ένα 4σέλιδο έγγραφο που δίνει σε unicode όλα τα αρχαία ελληνικά μουσικά σύμβολα. Εδώ δεν μου δίνει επιλογές να αλλάξω το OCR του συγκεκριμένου αρχείου-η ευκολία εμφανίζεται απενεργοποιημένη. Πήγα στη δεύτερη σελίδα του εγγράφου και αντέγραψα το δεύτερο σύμβολο της πέμπτης σειράς που μοιάζει σαν ένα κεφαλαίο "Γ" αλλά σε mirror form (βλέπει προς τα πίσω). Όταν το τοποθετώ στην αναζήτηση δεν εμφανίζεται το σύμβολο αυτό καθαυτό αλλά το τετραγωνίδιο που το περιέχει, αλλά κάνω αναζήτηση και με πηγαίνει στο συγκεκριμένο σύμβολο. Κάνω το ίδιο με διάφορα σύμβολα, αντιγράφω και επικολλώ στην αναζήτηση, πάντα εμφανίζεται ένα πανομοιότυπο ορθογώνιο σχήμα, ποτέ το unicode σύμβολο, αλλά η αναζήτηση με πάει πάντα στο συγκεκριμένο σύμβολο που αντέγραψα, όπου υπάρχει στο έγγραφό μου και όχι σε άλλα σύμβολα. Δεν είμαι σίγουρος για το τι να συμπεράνω απ' αυτό. Το acrobat παρ' όλο που δεν εμφανίζει το σύμβολο όταν το επικολλώ, ωστόσο το αναγνωρίζει σαν συγκεκριμένο και το διαφοροποιεί από τα υπόλοιπα, και έτσι με πάει στις περιπτώσεις όπου αυτό υπάρχει μες το έγγραφο. (?)
Στην παρούσα περίπτωση μου φαίνεται πως αυτό το έγγραφο unicode έχει μουσικολογική πρακτική αξία αν θα μπορούσε να τροποποιηθεί/βελτιωθεί για τη χρήση
πρακτικών μουσικών. Εννοώ αν θα μπορούσαμε κατά κάποιο τρόπο να συνδυάσουμε όλα τα σύμβολα με τα αντίστοιχα της σύγχρονης μουσικής γραφής τους στο πεντάγραμμο και να τα ενώσουμε σε ένα PDF. Μπορεί να το ψάξω στο μέλλον αυτό.

3 Υποπτεύομαι πως η διαδικασία που περιέγραψα συμβαίνει και με άλλα Unicode έγγραφα που περιέχουν άλλα σύμβολα, ζωδιακά σύμβολα, κυριλλικό αλφάβητο, κ.λπ. Αξίζει κάποια έρευνα και εδώ για μετατροπή τους σε επεξεργάσιμους οπτικούς χαρακτήρες.

4 Τελικά, για τα δικά μας έγραφα αυτής της ενότητας, σκέφτομαι χοντρικά πως δεν χρειάζονται παρά μόνο δύο σετ χαρακτήρων, το ελληνικό και το λατινικό αλφάβητο (οποιασδήποτε ινδοευρωπαϊκής γλώσσας). Τί νομίζεις?
U1D200-UNICODE GREEK SYMBOLS.pdf
(199.82 KiB) Μεταφορτώθηκε 6 φορές

Άβαταρ μέλους
peloponnisios
More than 100 posts user
Δημοσιεύσεις: 147
Εγγραφή: 14 Αύγ 2012 03:38 am

Re: Νέα υποσελίδα: Βιβλιοθήκη

#17 Δημοσίευση από peloponnisios »

socrates έγραψε:
15 Μάιος 2020 06:11 am
Συγνώμη Κώστα, μάλλον σε παίδεψα πολύ και χωρίς λόγο γιατί τα δέντρα μου έκρυβαν το δάσος που λένε.
Δεν πειράζει, Σωκράτη. Δεν έγινε τίποτα, σιγά το παίδεμα.
socrates έγραψε:
15 Μάιος 2020 06:11 am
1 Άφησα το OCR στα γαλλικά επίτηδες, γιατί πρόσεξα ένα τραγούδι με τίτλο "Parlez moi d' Amour", με σκοπό να το αναζητήσω. Ξαναέκανα το OCR ελληνικά και αντέγραψα τον τίτλο όπως είναι στο έγγραφο και τον επικόλλησα στην αναζήτηση όπου εμφανίζεται σαν (Parlez Π1Οi d'AΠ1our). Δεν καταλαβαίνω την αλλαγή στις λέξεις "moi" και "Amour" αλλά έλαβα μήνυμα από το adobe ότι ένα internal error συνέβη στην αντιγραφή, ωστόσο η αναζήτηση (Parlez Π1Οi d'AΠ1our) βρίσκει τον τίτλο, αλλά αν επικολλήσω το σωστό τίτλο "Parlez moi d' Amour" δεν τον βρίσκει. Ξανα-άλλαξα το OCR στα αγγλικά και με "Parlez moi d' Amour" η αναζήτηση δεν βρίσκει τίποτα, αλλά αν σβήσω τις άλλες λέξεις και αφήσω μόνο "Parlez" τότε βρίσκει το τραγούδι και στις δύο περιπτώσεις όπου ο τίτλος είναι παρών. Αλλά εδώ αν αναζητήσω με (Parlez Π1Οi d'AΠ1our) δεν βρίσκει τίποτα, και μου φαίνεται λογικό αυτό γιατί το OCR είναι τώρα στα αγγλικά. (?)
Το OCR δεν χρειάζεται να το πειράζεις, αυτό προσπαθώ να εξηγήσω. Γιατί αυτό που κάνεις, αν καταλαβαίνω καλά, είναι να λες στο πρόγραμμα να πραγματοποιήσει οπτική αναγνώριση χαρακτήρων ενώ έχει ήδη γίνει από μένα πριν το ανεβάσουμε. Εσύ αν θες να ψάξεις έναν όρο, απλώς αναζητάς με Edit/Find τίποτε άλλο. Αν όμως έψαχνες σε ένα άλλο pdf και δεν σου έβρισκε τίποτα, τότε θα μπορούσες να κάνεις το OCR γιατί θα σήμαινε ότι δεν έχει ήδη γίνει. Και μετά θα μπορούσες να κάνεις την αντίστοιχη αναζήτηση. Αυτό π.χ. μπορείς να το κάνεις για τα Ελληνικά στα συμπληρώματα Victor. Αφού έχεις το Acrobat Pro με το οποίο γίνεται μια χαρά αυτή δουλειά, κάνε ένα OCR για τα Ελληνικά εφόσον σου χρειάζεται κι έτσι θα μπορείς να βρίσκεις ελληνικούς όρους σε αυτά το pdf. Καταλαβαίνω αυτό που λες με τα σύμβολα και τα κουτάκια, αλλά γιατί θες να παιδεύεσαι; Δεν χρειάζεται να αλλάξεις κάτι στο pdf ούτε να αναζητάς με ακατανόητα σύμβολα. Για το Parlez moi, η αναζήτηση βρίσκει αποτέλεσμα γιατί όπως είπα στο προηγούμενο μήνυμα, το πρόγραμμα κοιτάει να βρει λατινικούς χαρακτήρες που χρησιμοποιεί η αγγλική γλώσσα. Δεν διαβάζει λέξεις. Έτσι θα σου βρει οτιδήποτε έχει π.χ. τα σύμφωνα p,r,l,z,m και τα φωνήεντα a,e,o,i γιατί είναι χαρακτήρες της αγγλικής γλώσσας (αλλά και της γαλλικής). Αν εσύ τώρα έκανες αναζήτηση για è, é, ê, πιθανότατα να μην σου επέστρεφε αποτελέσματα αφού δεν είναι χαρακτήρες που συναντώνται στην Αγγλική.
socrates έγραψε:
15 Μάιος 2020 06:11 am
2 Άνοιξα ένα pdf που μου φαίνεται κάπως πιο δύσκολο για ανάγνωση/οπτική αναγνώριση-το ανεβάζω συνημμένο. Είναι ένα 4σέλιδο έγγραφο που δίνει σε unicode όλα τα αρχαία ελληνικά μουσικά σύμβολα. Εδώ δεν μου δίνει επιλογές να αλλάξω το OCR του συγκεκριμένου αρχείου-η ευκολία εμφανίζεται απενεργοποιημένη. Πήγα στη δεύτερη σελίδα του εγγράφου και αντέγραψα το δεύτερο σύμβολο της πέμπτης σειράς που μοιάζει σαν ένα κεφαλαίο "Γ" αλλά σε mirror form (βλέπει προς τα πίσω). Όταν το τοποθετώ στην αναζήτηση δεν εμφανίζεται το σύμβολο αυτό καθαυτό αλλά το τετραγωνίδιο που το περιέχει, αλλά κάνω αναζήτηση και με πηγαίνει στο συγκεκριμένο σύμβολο. Κάνω το ίδιο με διάφορα σύμβολα, αντιγράφω και επικολλώ στην αναζήτηση, πάντα εμφανίζεται ένα πανομοιότυπο ορθογώνιο σχήμα, ποτέ το unicode σύμβολο, αλλά η αναζήτηση με πάει πάντα στο συγκεκριμένο σύμβολο που αντέγραψα, όπου υπάρχει στο έγγραφό μου και όχι σε άλλα σύμβολα. Δεν είμαι σίγουρος για το τι να συμπεράνω απ' αυτό. Το acrobat παρ' όλο που δεν εμφανίζει το σύμβολο όταν το επικολλώ, ωστόσο το αναγνωρίζει σαν συγκεκριμένο και το διαφοροποιεί από τα υπόλοιπα, και έτσι με πάει στις περιπτώσεις όπου αυτό υπάρχει μες το έγγραφο. (?)
Στην παρούσα περίπτωση μου φαίνεται πως αυτό το έγγραφο unicode έχει μουσικολογική πρακτική αξία αν θα μπορούσε να τροποποιηθεί/βελτιωθεί για τη χρήση
πρακτικών μουσικών. Εννοώ αν θα μπορούσαμε κατά κάποιο τρόπο να συνδυάσουμε όλα τα σύμβολα με τα αντίστοιχα της σύγχρονης μουσικής γραφής τους στο πεντάγραμμο και να τα ενώσουμε σε ένα PDF. Μπορεί να το ψάξω στο μέλλον αυτό.
Κατάλαβα τι γίνεται αλλά πολύ τα μπερδεύεις. Νομίζω πως δεν είναι χρήσιμα σε κάτι όλα αυτά. Και αυτό το τελευταίο με τα σύμβολα της μουσικής γραφής δεν μπορώ να βρω τι ιδιαίτερη εφαρμογή θα μπορούσε να έχει για να μας ωφελήσει. Να ψάξουμε δηλαδή για συγκεκριμένα σύμβολα σε παλιές χειρόγραφες παρτιτούρες; Γιατί; Άσε που δεν θα γινόταν αυτό γιατί το χειρόγραφο σύμβολο πιθανότατα δεν θα το έπιανε η αναζήτηση (ή θα το έβρισκε μια στο τόσο, άρα δεν θα είχε συνέπεια). Ή μήπως έχεις κάτι άλλο κατά νου;
socrates έγραψε:
15 Μάιος 2020 06:11 am
4 Τελικά, για τα δικά μας έγραφα αυτής της ενότητας, σκέφτομαι χοντρικά πως δεν χρειάζονται παρά μόνο δύο σετ χαρακτήρων, το ελληνικό και το λατινικό αλφάβητο (οποιασδήποτε ινδοευρωπαϊκής γλώσσας). Τί νομίζεις?
Για σχετικά με το ρεμπέτικο ντοκουμέντα που τυχαίνει να έχω και θα ανεβάσω σιγά σιγά έχω δει ότι μας χρειάζονται Ελληνικά (πολυτονικό ή/και μονοτονικό), Αγγλικά, Γαλλικά και πιθανώς Γερμανικά σε κάποια λίγα. Αλλά ανάλογα με το ντοκουμέντο ρυθμίζεται και το OCR, δεν είναι κάτι δύσκολο ούτε χρειάζεται ιδιαίτερη προετοιμασία.

Άβαταρ μέλους
peloponnisios
More than 100 posts user
Δημοσιεύσεις: 147
Εγγραφή: 14 Αύγ 2012 03:38 am

Re: Νέα υποσελίδα: Βιβλιοθήκη

#18 Δημοσίευση από peloponnisios »

Μήπως ξεφύγαμε αρκετά από το θέμα μας, που είναι τα παλιά ντοκουμέντα, τα σχετικά με το ρεμπέτικο, και πώς αυτά ανεβαίνουν στη Βιβλιοθήκη του σάιτ; Οκ, καταλαβαίνω ότι όλα αυτά που περιγράφεις ίσως έχουν πολύ ενδιαφέρον αλλά πιθανότατα όχι για μας εδώ. Μήπως να μετακινηθεί η προηγούμενη συζήτησή μας σε άλλο θέμα για να μείνει καθαρό αυτό το ποστ; Μάκη;

Επίσης, αν έχεις κάποια συγκεκριμένη υλοποίηση που θες να προτείνεις ή να προετοιμάσεις σχετικά με τη Βιβλιοθήκη, πες μας ή δείξε μας και αν είναι χρήσιμο το ενσωματώνουμε. Το λέω αυτό γιατί με την προηγούμενη δημοσίευση κάπου έχασα το νήμα και δεν είμαι σίγουρος αν με το παραπάνω σκέφτεσαι κάτι πολύ συγκεκριμένο που θα μας βοηθήσει ή αν εκθέτεις γενικά ιδέες με αφορμή τα searchable pdf...

Άβαταρ μέλους
Admin
Site Admin
Δημοσιεύσεις: 303
Εγγραφή: 01 Ιαν 1970 02:00 am
Επικοινωνία:

Re: Νέα υποσελίδα: Βιβλιοθήκη

#19 Δημοσίευση από Admin »

Το ξεχώρισα Σωκράτη και Κώστα σε νέο θέμα, οπότε Σωκράτη μπορεί να συνεχιστεί εκεί η κουβέντα:

Εδώ το νέο θέμα με τίτλο "Σύμβολα αρχαίας Ελληνικής μουσικής"
viewtopic.php?f=68&t=5505&p=34169#p34169

Απάντηση

Επιστροφή σε “Σχετικά με τη σελίδα μας”