Πώς να περικόψετε ένα σαρωμένο έγγραφο στο Word. Ένα παράδειγμα του τρόπου μεταφοράς ενός σαρωμένου εγγράφου στο Word. Διεπαφή και διαθέσιμες εργασίες

Καλησπέρα σε όλους!

Νομίζω ότι εκείνοι οι χρήστες που κάνουν συχνά εργασίες γραφείου (επεξεργασία και προετοιμασία εγγράφων, σάρωση, αποστολή τους κ.λπ.) συχνά σπαταλούν χρόνο για να κάνουν τα αρχεία ευπαρουσίαστα.

Για παράδειγμα, σκάναρα μια ντουζίνα δύο φύλλα του συμβολαίου και μετά κοιτάς: μερικά από τα φύλλα είναι ανάποδα (ή γενικά, κάποιο φύλλο είναι επιπλέον)... Τι να κάνω; Μπορείτε να σαρώσετε ξανά (κάτι που θα κάνουν οι περισσότεροι) ή μπορείτε πολύ γρήγορα να επεξεργαστείτε το έγγραφο χρησιμοποιώντας ειδικά εργαλεία. προγράμματα.

Στην πραγματικότητα, σε αυτό το άρθρο θέλω να εξετάσω αυτό το μικρό μέρος της εργασίας γραφείου. Νομίζω ότι μπορεί να είναι χρήσιμο σε πολλούς...

Να βοηθήσω!

Οδηγίες για τη σάρωση εγγράφων (σύνδεση του σαρωτή με υπολογιστή, επιλογή λογισμικού, λήψη κειμένου από σαρώσεις, κ.λπ. ερωτήσεις) -

Τροποποίηση και επεξεργασία εγγράφων PDF

1) Τι χρειάζεται για την εργασία (επιλογή λογισμικού)

Θα υποθέσω ότι έχετε ήδη το έγγραφο PDF (που θέλετε να επεξεργαστείτε). Τώρα πρέπει να επιλέξετε λογισμικό για να το αλλάξετε. Για μια απλή και γρήγορη λύση στο πρόβλημα (στο οποίο σταματήσαμε σε αυτό το άρθρο)θα κάνω Movavi PDF Editor.

Movavi PDF Editor

Πολύ συμπαγής και βολικό πρόγραμμα, επιτρέποντάς σας να επεξεργάζεστε γρήγορα αρχεία PDF! θα σημειώσω χαμηλά Απαιτήσεις συστήματοςαυτού του λογισμικού στο υλικό, χάρη στο οποίο είναι δυνατό ακόμη και σε "αδύναμο" υπολογιστές γραφείουανοίξτε και επεξεργαστείτε αρχεία PDF σε υψηλή ποιότητα(σε χρώμα με υψηλής ανάλυσης).

Ιδιαιτερότητες:

  • υπάρχουν όλες οι βασικές λειτουργίες επεξεργασίας: προσθήκη/διαγραφή σελίδων, περιστροφή σελίδων 90-180 μοίρες, εισαγωγή υπογραφών, εικόνων, συγχώνευση/διαίρεση εγγράφων, Μετατροπή PDFσε εικόνες (και η αντίστροφη λειτουργία).
  • το πρόγραμμα ανοίγει και σας επιτρέπει να αλλάξετε τη συντριπτική πλειοψηφία των αρχείων PDF (ακόμη και αρκετά μεγάλα, με υψηλή ανάλυση σάρωσης, η οποία είναι σημαντική για το γραφείο (πολλά άλλα προγράμματα μπορούν απλά να παγώσουν)).
  • χαμηλές απαιτήσεις συστήματος.
  • διαισθητική διεπαφή (παρεμπιπτόντως, το πρόγραμμα είναι εξ ολοκλήρου στα ρωσικά!).
  • συμβατό με Windows 7, 8, 10 (32/64 bit).

Ίσως το μόνο αρνητικό: πλήρη έκδοσηΤο πρόγραμμα κοστίζει 600 ρούβλια. (υπάρχουν όμως 7 μέρες για τεστ).

Παρακάτω στο άρθρο θα δείξω τα κύρια βήματα για την εργασία με τον επεξεργαστή PDF Movavi.

2) Άνοιγμα εγγράφου

Δεν σκέφτομαι να εγκαταστήσω και να εκκινήσω το πρόγραμμα επεξεργασίας (είναι στάνταρ). Για να ανοίξετε ένα αρχείο PDF, απλώς κάντε κλικ στο ομώνυμο κουμπί στο πρώτο παράθυρο του προγράμματος. (δείτε στιγμιότυπο οθόνης παρακάτω)

Παρεμπιπτόντως, σημειώνω ότι το πρόγραμμα κρατάει ιστορικό νωρίτερα ανοιχτά αρχεία, το οποίο με την πάροδο του χρόνου θα σας επιτρέψει να βρείτε γρήγορα έγγραφα με τα οποία εργάζεστε συχνά.

Το αρχείο πρέπει να ανοίξει στο πρόγραμμα επεξεργασίας. Η διεπαφή προγράμματος είναι γενικά τυπική: όλες οι σελίδες του εγγράφου παρουσιάζονται στα αριστερά και το ίδιο το έγγραφο βρίσκεται στο κέντρο.

Πώς μοιάζει ένα ανοιχτό έγγραφο στο Movavi PDF Editor

Τώρα μπορείτε να προχωρήσετε στην επεξεργασία...

3) Περιστρέψτε τις σελίδες 90-180°

Και έτσι, δεν ήταν τυχαίο που άνοιξα το έγγραφό μου: ορισμένες σελίδες σε αυτό σαρώθηκαν οριζόντια, αλλά χρειάζομαι τα πάντα σε κάθετη θέση (περίπου. : "στραβωμένο" εξειδικευμένο λογισμικό σαρωτή που συνοδεύει τα προγράμματα οδήγησης μορφοποιεί αυτόματα τη διάταξη του εγγράφου κατά την αποθήκευση ως PDF).

Για να μην αναζητάτε κάθε "λάθος" σελίδα σε κανονική λειτουργία προβολής, συνιστώ να μεταβείτε στην επισκόπηση όλων των σελίδων (για να το κάνετε αυτό, κάντε κλικ στο κουμπί, δείτε το στιγμιότυπο οθόνης παρακάτω).

Περιστροφή σελίδων / Με δυνατότητα κλικ

Οι λειτουργίες εναλλαγής σελίδας εκτελούνται πολύ γρήγορα: κυριολεκτικά δύο ή τρία κλικ και όλα τα φύλλα στα έγγραφά μου έγιναν κατακόρυφα (βλ. παράδειγμα παρακάτω).

Για να επιστρέψετε στο κανονική λειτουργίαεργαστείτε με το έγγραφο, κάντε κλικ στο κουμπί στον πίνακα "Πίσω"(δείτε στιγμιότυπο οθόνης παρακάτω).

Λάβετε υπόψη ότι μπορείτε επίσης να περιστρέψετε τη σελίδα στο μενού στα αριστερά (το μόνο σημείο: δεν είναι πολύ βολικό να τα "ψάξετε" εδώ...) .

4) Αφαίρεση και εισαγωγή σελίδων, εικόνων

Σχετικά με διαγραφή σελίδας- τότε όλα είναι απλά εδώ: πρώτα, πρέπει να επιλέξετε τη σελίδα στο μενού στα αριστερά, στη συνέχεια να κάνετε δεξί κλικ πάνω της και να επιλέξετε "διαγραφή" στο μενού (παράδειγμα παρακάτω).

Μπορείτε επίσης να χρησιμοποιήσετε το κλειδί Διαγραφή.

Οσον αφορά εισαγωγή νέων σελίδων(και εικόνες) στο έγγραφο, τότε αυτό είναι λίγο πιο ενδιαφέρον. Πρώτα πρέπει να μεταβείτε στην καρτέλα.

Σημειώστε ότι θα έχετε μία κενή σελίδα στο τέλος του εγγράφου. Δείτε το στιγμιότυπο οθόνης παρακάτω.

Σύροντας αυτήν την άδεια σελίδα με το ποντίκι, μπορείτε να τη μετακινήσετε στο επιθυμητό μέρος του εγγράφου. Για παράδειγμα, το έβαλα στη θέση της πρώτης σελίδας (παρεμπιπτόντως, μπορείτε να ταξινομήσετε ολόκληρο το έγγραφο με τον ίδιο τρόπο, να ανταλλάξετε σελίδες και να τις μετακινήσετε στο σωστό μέρος) .

Για να εισαγάγετε μια εικόνα (εικόνα): παω σε επιθυμητή σελίδα, V επάνω μενούεπιλογή επιλογής. Στη συνέχεια, θα ανοίξει το μενού Explorer, όπου μπορείτε να επιλέξετε αυτό που χρειάζεστε.

Για παράδειγμα, έβαλα ένα στιγμιότυπο οθόνης στις επεξεργασμένες οδηγίες σχετικά με τον τρόπο προβολής των χαρακτηριστικών ενός Η/Υ (ιδίως η θερμοκρασία του σκληρού δίσκου). Παράδειγμα παρακάτω.

Η εικόνα προστίθεται στο έγγραφο

5) Συνδυασμός 2 εγγράφων σε 1

Επίσης μια αρκετά τυπική εργασία (ιδιαίτερα δυσάρεστη όταν ένα έγγραφο αποτελείται από 3-4 ή περισσότερα αρχεία PDF). Πώς να τα συγκεντρώσετε όλα σε ένα;

Μέθοδος #1

Αρχικά, πρέπει να ανοίξετε το πρώτο έγγραφο (σελίδα) και να μεταβείτε στη λειτουργία αναθεώρησης για όλες τις σελίδες (δείτε στιγμιότυπο οθόνης παρακάτω).

Όλες οι σελίδες του εγγράφου που προστέθηκε θα εμφανιστούν στο τέλος ανοιχτό έγγραφο(συγγνώμη για την ταυτολογία). Έτσι, στην πραγματικότητα «κολλάμε» δύο έγγραφα σε ένα.

Προσθέτοντας συνεχώς όλα τα «μικρά» έγγραφα - θα μπορείτε να συναρμολογήσετε από αυτά ένα «μεγάλο» που θέλατε αρχικά...

Μέθοδος #2

Αυτή η επιλογή είναι απλούστερη. Μετά την εκκίνηση του προγράμματος, απλώς κάντε κλικ στο κουμπί (στο παράθυρο έναρξης στα δεξιά).

Παρεμπιπτόντως!

Εάν το έγγραφο PDF σας αποδειχθεί πολύ μεγάλο (και αυτό συμβαίνει επίσης κατά καιρούς), τότε μπορείτε να το συμπιέσετε. Σε ένα από τα προηγούμενα άρθρα μου έδωσα πολλές επιλογές, προτείνω -

Αυτα για τωρα. Οι προσθήκες είναι ευπρόσδεκτες...

Πρόγραμμα οπτικής αναγνώρισης κειμένου. Το ABBYY FineReader μπορεί να αναγνωρίσει κείμενο από σαρωμένα έγγραφα σε χαρτί, αρχεία PDF και έγγραφα που έχουν καταγραφεί με ψηφιακή φωτογραφική μηχανή. Τα έγγραφα κειμένου που αναγνωρίζονται από το πρόγραμμα μπορούν να επεξεργαστούν περαιτέρω χρησιμοποιώντας εφαρμογές της MicrosoftΓραφείο. Εάν είναι απαραίτητο, ολόκληρη η δομή του σχεδιασμού του εγγράφου θα διατηρηθεί κατά την αναγνώριση κειμένου. Το FineReader λειτουργεί με όλα τα δημοφιλή μοντέλα σύγχρονων σαρωτών και πολυλειτουργικές συσκευές(MFP). Εάν ο χρήστης χρειάζεται να σαρώσει και να αναγνωρίσει μεγάλο αριθμό σελίδων κειμένου, τότε το πρόγραμμα παρέχει μια ειδική λειτουργία για εργασία με αυτόματους σαρωτές(σαρωτής με αυτόματο τροφοδότη χαρτιού). Το πρόγραμμα μπορεί να αναγνωρίσει κείμενο σε αρχεία των ακόλουθων μορφών: PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG, DjVu· εάν είναι απαραίτητο, οι ψηφιακές εικόνες θα υποβληθούν σε επεξεργασία για τη βελτίωση της ποιότητας της οπτικής αναγνώρισης κειμένου (η εικόνα μπορεί να περικοπεί και να καθαριστεί από περιττά στοιχεία, να εξαλείψει ανακρίβειες, παραμόρφωση γραμμών, περιστροφή ή καθρέφτη).

Το πρόγραμμα είναι μια ολοκληρωμένη εφαρμογή για εργασία με έγγραφα κειμένου. Ο κύριος σκοπός του είναι η οπτική αναγνώριση χαρακτήρων. Δημιουργός του προγράμματος είναι η ρωσική εταιρεία ABBYY Software (ο παγκόσμιος ηγέτης στον τομέα των συστημάτων αναγνώρισης). Η εφαρμογή μεταφράζει γρήγορα και με ακρίβεια τα σαρωμένα έγγραφα σε επεξεργάσιμη μορφή, διατηρώντας όλα τα στοιχεία της αρχικής πηγής. Το FineReader μπορεί να αναγνωρίσει αρχεία PDF, ψηφιακές φωτογραφίες και έντυπα έγγραφα. Το πρόγραμμα αναπαράγει με ακρίβεια την εμφάνιση της αρχικής πηγής, υποστηρίζει την αναγνώριση κειμένου σε 186 γλώσσες και παρέχει άμεση εξαγωγή σε εφαρμογές του Microsoft Office.

Χρησιμοποιώντας την εφαρμογή, εργασίες όπως: δημιουργία και επεξεργασία ηλεκτρονικών εγγράφων με βάση πηγές χαρτιού, μετάφραση εγγράφων κακής ποιότητας σε επεξεργάσιμη μορφή, επεξεργασία εγγράφων με περίπλοκη δομή περιεχομένου, συμπεριλαμβανομένων πινάκων, εικονογραφήσεων, διαγραμμάτων κ.λπ., αναζήτηση και επεξεργασία κειμένου επιλύονται σε οποιαδήποτε μορφή. Σύμφωνα με τους περισσότερους ειδικούς, το πρόγραμμα είναι το καλύτερο στον τομέα του.

Αν μιλάμε για την πρακτική της χρήσης αυτού του προγράμματος στο RuNet, τότε πολλοί χρήστες γνωρίζουν από καιρό αυτό το πρόγραμμα Fine Reader (ρωσική μετάφραση του ονόματος), ο κύριος σκοπός του οποίου είναι να εκτελέσει τη λεγόμενη οπτική αναγνώριση κειμένου. Για να το θέσω απλά, χρησιμοποιώντας αυτό το πρόγραμμα, κάθε κείμενο που εκτυπώνεται σε χαρτί μπορεί να μετατραπεί σε μία από τις ηλεκτρονικές μορφές. Τελευταία έκδοσητο πρόγραμμα δεν είναι μόνο ενημερωμένο και πολλά άλλα φιλική προς το χρήστη διεπαφή, αλλά και βελτιωμένη λειτουργικότητα.

Στην πραγματικότητα, όλες οι βασικές ενέργειες μπορούν να εκτελεστούν με ένα κλικ του ποντικιού, το οποίο επιλέγει μία από τις ενέργειες που προσφέρονται κατά την εκκίνηση του προγράμματος. Μεταξύ αυτών είναι η δυνατότητα σάρωσης εγγράφων σε μορφή .doc, μετατροπής φωτογραφιών, σάρωσης σε Excel, αποθήκευσης εικόνων και σάρωσης, αναγνώρισης εικόνων κ.λπ. Προκειμένου να βελτιωθεί η χρηστικότητα του προγράμματος, Χώρος εργασίαςέχει μεγεθυνθεί και τα κουμπιά που ενεργοποιούν αυτήν ή εκείνη την ενέργεια βρίσκονται τώρα στην πλαϊνή γραμμή.

Για να μην μπερδευτεί ο χρήστης, από προεπιλογή όλα τα αρχεία που ανοίγει αναγνωρίζονται αυτόματα. Εάν είναι απαραίτητο, ένας έμπειρος χρήστης μπορεί να κάνει βαθιές προσαρμογές στη λειτουργικότητα του FineReader. Και η εργασία με εικόνες έχει απλοποιηθεί πολύ χάρη στο νέο διάλογο. Η χρήση της εφαρμογής σάς επιτρέπει να αναγνωρίζετε έγγραφα γραμμένα σε περισσότερες από μία γλώσσες, να μετατρέπετε αρχεία PDF, να αναγνωρίζετε γραμμωτούς κώδικες και να διεξάγετε μορφολογικές αναζητήσεις. Και παρόλο που απέχει πολύ από την πλήρη λίστα των δυνατοτήτων του, αυτό από μόνο του μπορεί να ενθαρρύνει πολλούς χρήστες να εγκαταστήσουν το Fine Reader σε μόνιμη βάση και να το χρησιμοποιήσουν όπως απαιτείται.

Και για να συνοψίσουμε τα παραπάνω, μπορούμε να περιγράψουμε συνοπτικά αυτό: λειτουργικότητα: Αυτό το πρόγραμμα χρησιμοποιείται για την οπτική αναγνώριση διαφόρων εγγράφων κειμένου. Κατά την αναγνώριση κειμένου, το πρόγραμμα διατηρεί την αρχική μορφοποίηση και σχεδίαση του εγγράφου (έγχρωμο κείμενο, κείμενο σε φόντο εικόνων, διαφορετικά στυλ γραμματοσειράς, αναδίπλωση κειμένου γύρω από εικόνες, πίνακες κ.λπ.). Το FineReader μπορεί να εργαστεί με σαρωμένα έγγραφα σε χαρτί (λειτουργεί σχεδόν με όλα τα δημοφιλή μοντέλα σαρωτών και πολυλειτουργικών συσκευών), με έγγραφα που καταγράφονται από ψηφιακές κάμερες και αναγνωρίζει κείμενο και γραφικά από αρχεία PDF. Εξάγει επίσης αποτελέσματα οπτικής αναγνώρισης κειμένου σε δημοφιλή εφαρμογές γραφείου: Word, Excel, PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice. Το αναγνωρισμένο κείμενο μπορεί να αποθηκευτεί σε διάφορες μορφές: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, Unicode TXT, Word ML, LIT, DBF.

Το λογισμικό OCR σάς επιτρέπει να μετατρέπετε φωτογραφημένα ή σαρωμένα έγγραφα απευθείας σε προτάσεις.

Το γεγονός είναι ότι το κείμενο στην εικόνα παρουσιάζεται με τη μορφή ράστερ, ένα σύνολο κουκκίδων. Το αναφερόμενο λογισμικό μετατρέπει ένα σύνολο κουκκίδων σε πλήρες κείμενο, διαθέσιμο για επεξεργασία και αποθήκευση.

Η αναγνώριση γραμμάτων έχει σχεδιαστεί για τη βελτιστοποίηση της διαδικασίας ψηφιοποίησης έντυπων ή χειρόγραφων βιβλίων και εγγράφων.

Αυτή η μέθοδος ψηφιοποίησης είναι τάξεις μεγέθους ταχύτερη από την ταχύτητα της χειροκίνητης πληκτρολόγησης από μια εικόνα. Χρησιμοποιείται ευρέως στην ψηφιοποίηση βιβλιοθηκών και αρχείων. Στη συνέχεια, θα εξετάσουμε τους πέντε καλύτερους εκπροσώπους της οικογένειας παρόμοιων προγραμμάτων.

ABBYY FineReader 10

Το FineReader είναι ο αδιαμφισβήτητος ηγέτης μεταξύ όλων των προγραμμάτων που αναγνωρίζουν κείμενο σε εικόνες. Συγκεκριμένα, δεν υπάρχει λογισμικό που να επεξεργάζεται το κυριλλικό αλφάβητο πιο καθαρά. Γενικά, το FineReader έχει 179 γλώσσες, το κείμενο στις οποίες αναγνωρίζεται με εξαιρετική επιτυχία.

Το μόνο πράγμα που μπορεί να απογοητεύσει τους χρήστες είναι ότι το πρόγραμμα πληρώνεται. Διανέμεται μόνο δωρεάν δοκιμαστική έκδοσηγια 15 ημέρες. Κατά τη διάρκεια αυτής της περιόδου, επιτρέπεται η σάρωση 50 σελίδων.

Στη συνέχεια θα πρέπει να πληρώσετε για να χρησιμοποιήσετε το πρόγραμμα. Το FineReader «τρώει» εύκολα, περισσότερο ή λιγότερο εικόνα υψηλής ποιότητας. Η πηγή είναι εντελώς ασήμαντη. Είτε πρόκειται για φωτογραφία, είτε για σάρωση σελίδας είτε για οποιαδήποτε εικόνα με γράμματα.

Πλεονεκτήματα:

  • ακριβής αναγνώριση?
  • ένας τεράστιος αριθμός γλωσσών ανάγνωσης.
  • ανοχή στην ποιότητα της εικόνας πηγής.

Ελάττωμα:

  • δοκιμαστική έκδοση για 15 ημέρες.

OCR CuneiForm

Δωρεάν λογισμικό ανάγνωσης πληροφορίες κειμένουαπό εικόνες. Η ακρίβεια αναγνώρισης είναι μια τάξη μεγέθους μικρότερη από αυτή του προηγούμενου προγράμματος που εξετάζεται. Αλλά πώς για δωρεάν βοηθητικό πρόγραμμα, η λειτουργικότητα είναι ακόμα εξαιρετική.

Ενδιαφέρων! Το CuneiForm αναγνωρίζει μπλοκ κειμένου, γραφικών, ακόμη και διάφορους πίνακες. Επιπλέον, ακόμη και πίνακες χωρίς γραμμή μπορούν να διαβαστούν.

Για να εξασφαλιστεί η ακρίβεια, συνδέονται ειδικά λεξικά με τη διαδικασία αναγνώρισης, τα οποία συμπληρώνουν το λεξιλόγιο από σαρωμένα έγγραφα.

Πλεονεκτήματα:

  • δωρεάν διανομή;
  • χρησιμοποιώντας λεξικά για να ελέγξετε την ορθότητα του κειμένου.
  • σάρωση κειμένου από φωτοτυπίες κακής ποιότητας.

Ελαττώματα:

  • σχετικά χαμηλή ακρίβεια.
  • μικρός αριθμός γλωσσών που υποστηρίζονται.

WinScan2PDF

Δεν είναι καν πλήρες πρόγραμμα, αλλά μια χρησιμότητα. Δεν απαιτείται εγκατάσταση και το εκτελέσιμο αρχείο ζυγίζει μόνο μερικά kilobyte. Η διαδικασία αναγνώρισης είναι εξαιρετικά γρήγορη, αν και τα έγγραφα που προκύπτουν αποθηκεύονται αποκλειστικά σε μορφή PDF.

Στην πραγματικότητα, όλη η διαδικασία πραγματοποιείται με το πάτημα τριών κουμπιών: επιλογή της πηγής, του προορισμού και, στην πραγματικότητα, εκκίνηση του προγράμματος.

Το βοηθητικό πρόγραμμα έχει σχεδιαστεί για γρήγορη μαζική επεξεργασία πολλών αρχείων. Για τη διευκόλυνση των χρηστών, παρέχεται ένα μεγάλο πακέτο γλώσσας διεπαφής.

Πλεονεκτήματα:

Ελαττώματα:

SimpleOCR

Ένα εξαιρετικό μικρό πρόγραμμα για την αναγνώριση κειμένων από εικόνες. Υποστηρίζει ακόμη και την ανάγνωση χειρογράφων. Το πρόβλημα είναι ότι τα ρωσικά δεν περιλαμβάνονται ούτε στο πακέτο γλώσσας διεπαφής ούτε στη λίστα των γλωσσών που υποστηρίζονται για αναγνώριση.

Ωστόσο, εάν πρέπει να σαρώσετε αγγλικά, δανικά ή γαλλικά, τότε δεν θα βρείτε καλύτερη δωρεάν επιλογή.

Στο πεδίο εφαρμογής του, το πρόγραμμα παρέχει ακριβή αποκωδικοποίηση γραμματοσειρών, αφαίρεση θορύβου και εξαγωγή γραφικών εικόνων. Επιπλέον, η διεπαφή προγράμματος έχει ενσωματωμένη επεξεργαστής κειμένου, σχεδόν πανομοιότυπο με το WordPad, γεγονός που αυξάνει σημαντικά τη χρηστικότητα του προγράμματος.

Πλεονεκτήματα:

  • Ακριβής αναγνώριση κειμένου.
  • βολικό πρόγραμμα επεξεργασίας κειμένου.
  • αφαίρεση του θορύβου από μια εικόνα.

Ελαττώματα:

  • πλήρης απουσία ρωσικής γλώσσας.

Freemore OCR

Το πρόγραμμα σάς επιτρέπει να εξάγετε γρήγορα κείμενο και γραφικά από εικόνες. Το λογισμικό υποστηρίζει την εργασία με πολλούς σαρωτές χωρίς απώλεια απόδοσης. Το εξαγόμενο κείμενο μπορεί να αποθηκευτεί σε ένα έγγραφο κειμένου ή σε μορφή εγγράφου MS Office.

Επιπλέον, παρέχεται μια λειτουργία αναγνώρισης πολλών σελίδων.

Το Freemore OCR διανέμεται δωρεάν, ωστόσο, η διεπαφή είναι μόνο στα αγγλικά. Αλλά αυτή η περίσταση δεν επηρεάζει σε καμία περίπτωση την ευκολία χρήσης, επειδή τα χειριστήρια είναι οργανωμένα με διαισθητικό τρόπο.

Πλεονεκτήματα:

  • δωρεάν διανομή;
  • ικανότητα εργασίας με πολλαπλούς σαρωτές.
  • η ακρίβεια αναγνώρισης είναι αξιοπρεπής.

Ελαττώματα

  • Έλλειψη ρωσικής γλώσσας στη διεπαφή.
  • Η ανάγκη λήψης του πακέτου ρωσικής γλώσσας για αναγνώριση.

Εάν έχετε επιλέξει τον γρήγορο τρόπο σύνταξης ενός θεωρητικού κεφαλαίου, για τον οποίο μιλήσαμε στην παράγραφο 2.1., πιθανότατα δεν θα μπορείτε να κάνετε χωρίς σάρωση εγγράφων. Διαφορετικά, μπορείτε να παραλείψετε αυτό το σημείο και να αρχίσετε να κρατάτε σημειώσεις για υλικά που βρίσκονται στη βιβλιοθήκη.

Πριν ξεκινήσετε τη σάρωση, πρέπει να αποφασίσετε τι ακριβώς θέλετε να χρησιμοποιήσετε κατά τη σύνταξη της εργασίας σας. Και για να το κάνετε αυτό, πρέπει πρώτα να κοιτάξετε τη διαθέσιμη βιβλιογραφία και να επισημάνετε τα απαραίτητα σημεία με ένα μολύβι.

Την πρώτη φορά που σκάναρα ένα άρθρο περιοδικού για την πρώτη μου εργασία, βρήκα το έργο απίστευτα δύσκολο. Ως αποτέλεσμα πολλών ωρών εργασίας με το σαρωτή και το FineReader, η έξοδος ήταν ανοησία που δεν ήταν δυνατή η επεξεργασία. Στο τέλος, έπρεπε να πληκτρολογήσω τα πάντα με το χέρι. Για να μην συμβεί αυτό σε εσάς, ας ρίξουμε μια πιο προσεκτική ματιά σε όλες τις τεχνικές πτυχές της σάρωσης.

Για τη σάρωση, θα χρειαστούμε, φυσικά, έναν σαρωτή. Δεν χρειάζεται να το αγοράσετε. Μπορείτε, για παράδειγμα, να δανειστείτε κάτι από έναν φίλο για λίγο. Χρησιμοποιώ σαρωτή CanoScan Lide 60. Αν και δεν είναι ο πιο πολύς νέο μοντέλο, αλλά μου αρέσει πολύ αυτή η συμπαγής, γρήγορη και εύχρηστη «συσκευή». Εάν δανειστείτε έναν σαρωτή, για να λειτουργήσει, πρέπει πρώτα να εγκαταστήσετε το πρόγραμμα οδήγησης. Μπορείτε πάντα να βρείτε προγράμματα οδήγησης και οδηγίες εγκατάστασης στη διεύθυνση δίσκο εγκατάστασης, το οποίο περιλαμβάνεται στη συσκευή ή μπορείτε να το κατεβάσετε από τον ιστότοπο του κατασκευαστή. Μετά την εγκατάσταση του προγράμματος οδήγησης, συνδέστε το σαρωτή στον υπολογιστή σας χρησιμοποιώντας το καλώδιο σύνδεσης. Τώρα μπορείτε να ξεκινήσετε απευθείας τη σάρωση.

Αλλά πρώτα, μια μικρή θεωρία. Θα πρέπει να γνωρίζετε ότι η διαδικασία σάρωσης αποτελείται από δύο στάδια:

1. Απευθείας σάρωση του εγγράφου. Σε αυτό το στάδιο, ο σαρωτής τραβάει μια φωτογραφία της επιφάνειας του εγγράφου που σαρώνεται και αποθηκεύει την εικόνα που προκύπτει στον υπολογιστή ως κανονικό αρχείο .jpg .gif ή σε άλλη μορφή.

2. Αναγνώριση εγγράφων. Αυτή είναι η διαδικασία μετατροπής κειμένου από μια εικόνα που λαμβάνεται από έναν σαρωτή σε μια κανονική δοκιμή, η οποία μπορεί στη συνέχεια να αποθηκευτεί στο Word και να επεξεργαστεί. Η αναγνώριση πραγματοποιείται χωρίς τη συμμετοχή σαρωτή, χρησιμοποιώντας ένα ειδικό πρόγραμμα (το πιο δημοφιλές είναι το Adobe FineReader). Με αυτόν τον τρόπο, μπορείτε πρώτα να σαρώσετε πολλά φύλλα κειμένου και να τα αποθηκεύσετε ως εικόνα πριν τα μετατρέψετε σε κείμενο.

Λοιπόν, ας ξεκινήσουμε πρώτο στάδιο - σάρωση:

– εκκίνηση του προγράμματος οδήγησης σαρωτή: Έναρξη - Όλα τα προγράμματα - Canon - ScanGear(Δηλώνω το όνομα του προγράμματος οδήγησης για τον σαρωτή μου). Θα εμφανιστεί το παράθυρο του προγράμματος οδήγησης:

– ανοίξτε το καπάκι του σαρωτή και τοποθετήστε ένα βιβλίο, περιοδικό ή αντίγραφό τους με το κείμενο στραμμένο προς τα κάτω, όσο το δυνατόν πιο ομοιόμορφα σε σχέση με τις άκρες της επιφάνειας εργασίας του σαρωτή:

Είναι πολύ σημαντικό εδώ να διασφαλίσετε ότι το καπάκι του σαρωτή πιέζει το σαρωμένο έγγραφο όσο το δυνατόν πιο σφιχτά, αποτρέποντας το εξωτερικό φως να φτάσει στην επιφάνεια εργασίας του σαρωτή που έρχεται σε επαφή με το έγγραφο.

- ας το κάνουμε απαραίτητες ρυθμίσειςστο πρόγραμμα οδήγησης του σαρωτή. Το πρώτο βήμα είναι να ορίσετε την ανάλυση στην οποία θα σαρωθεί το έγγραφο. Η ανάλυση είναι ένας δείκτης που καθορίζει το επίπεδο λεπτομέρειας ενός αντικειμένου κατά τη σάρωση και προσδιορίζεται σε κουκκίδες ανά ίντσα (dpi ή dpi). Όσο υψηλότερη είναι η ανάλυση, τόσο καλύτερη είναι η ποιότητα της εικόνας. Όμως, κατά τη σάρωση εγγράφων κειμένου, δεν έχει νόημα να ορίσετε τη μέγιστη ανάλυση, καθώς αυτή θα είναι μηδενικής χρήσης. Επιπλέον, η σάρωση σε υψηλότερες αναλύσεις διαρκεί περισσότερο. Συνιστώ να ρυθμίσετε την ανάλυση μεταξύ 400-500 dpi. Με αυτήν τη ρύθμιση, οι εικόνες είναι επαρκούς ποιότητας για καλή αναγνώριση και η ίδια η διαδικασία σάρωσης δεν απαιτεί πολύ χρόνο. Προτείνω να δείτε ένα στιγμιότυπο οθόνης των ρυθμίσεων του εκτυπωτή μου:


Πρώτα πρέπει να πάτε στο "Προηγμένη λειτουργία".Η πηγή θα είναι πάντα "Δισκίο"(επίπεδος σαρωτής). Είναι καλύτερα να ρυθμίσετε τη λειτουργία χρώματος "Μαύρο και άσπρο", επειδή δεν χρειαζόμαστε χρώματα για τη σάρωση κειμένου και αυτό θα μειώσει το μέγεθος των εικόνων εξόδου. Το ψήφισμα, όπως είπα, πρέπει να τεθεί 400 dpi. Μέγεθος εικόνας εξόδου – απαιτείται “A4”. Τώρα μπορείτε να πατήσετε με ασφάλεια το κουμπί "Σάρωση". Ο σαρωτής μου έχει σχεδιαστεί με τέτοιο τρόπο ώστε να αποθηκεύει πρώτα τις σαρωμένες εικόνες εσωτερική μνήμη, και μόνο όταν κλείνετε το παράθυρο του προγράμματος οδήγησης προσφέρει την αποθήκευση στον υπολογιστή. Το μόνο που έχω να κάνω είναι να υποδείξω τη θέση όπου θα αποθηκευτούν τα αποτελέσματα της εργασίας.

Θα πρέπει να καταλήξετε με αρχεία αυτού του τύπου:

Όταν μεγεθύνετε μια τέτοια εικόνα, το κείμενο θα πρέπει να είναι καθαρά ορατό.

Δεύτερη φάσηαναγνώρισηλαμβάνετε εικόνες και τις μετατρέπετε σε κείμενο. Όπως είπα ήδη, αυτό θα απαιτήσει ένα ειδικό πρόγραμμα - FineReader. Κατεβάστε το πρόγραμμα από αυτόν τον σύνδεσμο (32MB). Κωδικός πρόσβασης αρχείου – ιστότοπος. Η έκδοση που προτείνω δεν απαιτεί εγκατάσταση (φορητή). Θα υπάρχουν πολλά διαφορετικά αρχεία στο φάκελο του προγράμματος, αλλά χρειάζεστε μόνο ένα - FineReader.exe. Κάνοντας διπλό κλικ σε αυτό το αρχείο θα ξεκινήσει το πρόγραμμα στον υπολογιστή σας.

Αυτή η έκδοση του προγράμματος είναι αρκετά παλιά. Τράβηξα όλα τα παρακάτω στιγμιότυπα οθόνης χρησιμοποιώντας το. Αν αυτή η έκδοση FineReaderδεν λειτουργεί για εσάς - επιλέξτε ένα νεότερο.

Παράθυρο FineReaderέχει την εξής μορφή:

Αφού ορίσετε τη γλώσσα στην οποία εκτυπώθηκαν τα έγγραφα που σαρώσατε προηγουμένως, μπορείτε να ξεκινήσετε την αναγνώριση. Εάν το κείμενο περιέχει δύο γλώσσες ταυτόχρονα (για παράδειγμα, ρωσικά και αγγλικά), κάντε την εγκατάσταση ανάλογα.

Για να ξεκινήσετε την αναγνώριση, κάντε κλικ στο βέλος στα δεξιά του πρώτου κουμπιού Σάρωση- και μετά - Άνοιγμα εικόνας:

Θα ανοίξει το παράθυρο επιλογής εικόνας. Ανοίξτε το φάκελο όπου αποθηκεύσατε τις σαρωμένες εικόνες, κάντε κλικ CTRL+A(Αγγλικά) στο πληκτρολόγιο και πατήστε το κουμπί Ανοιξε.

Μετά από αυτό στα αριστερά στο παράθυρο FineReaderΘα εμφανιστούν μικρογραφίες των αρχείων που προστέθηκαν, στο κέντρο - επάνω αυτή τη στιγμήτο επιλεγμένο σκίτσο μεγεθύνεται, παρακάτω υπάρχει ακόμη μεγαλύτερη αύξηση και στα δεξιά το αποτέλεσμα αναγνώρισης:

Για παράδειγμα, τράβηξα μόνο δύο εικόνες. Το πρώτο από αυτά επισημαίνεται στο παραπάνω στιγμιότυπο οθόνης· μπορούμε να το αναγνωρίσουμε τώρα. Όπως μπορείτε να δείτε, η εικόνα σαρώθηκε κάθετα· για να αναγνωριστεί το κείμενο, πρέπει πρώτα να περιστραφεί η εικόνα κατά 90 μοίρες. Για να το κάνετε αυτό, χρησιμοποιήστε τα κουμπιά και. Το επόμενο βήμα είναι να πείτε στο πρόγραμμα ποιο μέρος της εικόνας πρέπει να αναγνωριστεί και επίσης να ορίσετε τον τύπο δεδομένων που πρέπει να εξάγονται: κείμενο, πίνακας ή εικόνα. Υπάρχουν κουμπιά για αυτό, αντίστοιχα: . Για παράδειγμα, εάν θέλετε να επισημάνετε ένα μπλοκ κειμένου, κάντε αριστερό κλικ στο και, στη συνέχεια, κάντε αριστερό κλικ στην επάνω αριστερή γωνία του μπλοκ κειμένου και, ενώ κρατάτε πατημένο το αριστερό κουμπί, σύρετέ το στην κάτω δεξιά γωνία. Για παράδειγμα, έχω προετοιμάσει πλήρως μια εικόνα για αναγνώριση:

Όπως μπορείτε να δείτε, όλα τα μπλοκ κειμένου στο παραπάνω παράδειγμα επισημαίνονται με πράσινο και οι εικόνες επισημαίνονται με κόκκινο. Οι πίνακες προετοιμάζονται για αναγνώριση με τον ίδιο τρόπο. Για αυτό χρησιμεύει το κουμπί. Για να μεταβείτε στην επόμενη φωτογραφία, κάντε αριστερό κλικ στη μικρογραφία της στα αριστερά. Με αυτόν τον τρόπο, όλες οι εικόνες που λαμβάνονται ως αποτέλεσμα της σάρωσης προετοιμάζονται για αναγνώριση. Αφού ολοκληρωθεί η προετοιμασία των εικόνων, θα πρέπει να τις επιλέξετε όλες. Για να το κάνετε αυτό, κάντε αριστερό κλικ σε ένα κενό χώρο στον πίνακα μικρογραφιών (λέγεται Πλαστική σακούλα) και πατήστε Ctrl+A(Αγγλικά) στο πληκτρολόγιο. Στη συνέχεια, κάντε κλικ στο κουμπί και περιμένετε μέχρι FineReaderμετατρέπει τις εικόνες σε κείμενο. Μετά από αυτό, μπορείτε να αποθηκεύσετε το κείμενο που προκύπτει στο Word χρησιμοποιώντας το κουμπί, αφού κάνετε κλικ στο οποίο θα ανοίξει ένα παράθυρο. Σε αυτό πρέπει να επιλέξετε τη μορφή για αποθήκευση - Microsoft Wordκαι επιλέξτε επίσης το πλαίσιο για να αποθηκεύσετε όλες τις σελίδες:

Αφού πατήσετε το κουμπί Εντάξειτο πρόγραμμα θα δημιουργήσει Έγγραφο του Wordκαι εισάγει κείμενο από τις αναγνωρισμένες σελίδες σε αυτό με τη σειρά με την οποία βρίσκονται στον πίνακα μικρογραφιών (Παρτίδα). Αποθηκεύστε αμέσως το ληφθέν έγγραφο σε έναν φάκελο δομή αρχείουδιατριβή και μπορείτε να ξεκινήσετε την επεξεργασία. Πώς γίνεται αυτό περιγράφεται στο δικό μου δωρεάν μάθημα.

Και ένα τελευταίο σημείο. Εάν σαρώσετε μια εφημερίδα ή ένα περιοδικό, το κείμενο εκεί δίνεται συχνά με τη μορφή στηλών (όπως στο παραπάνω παράδειγμα). Αυτές οι στήλες στο Word πρέπει να μετατραπούν σε μία. Επιλέξτε το κείμενο σε στήλες και εκτελέστε την εντολή: Μορφή – Στήλες – Μία – ΟΚ. Μόνο μετά από αυτό μπορείτε να ορίσετε τον προσανατολισμό κατακόρυφου προσανατολισμού στη Διαμόρφωση σελίδας, την προσθήκη περιθωρίων, τη γραμματοσειρά κ.λπ.

Πώς να σαρώσετε ένα έγγραφο και να το αναγνωρίσετε στο MS Word

Η αποθήκευση σαρωμένων εγγράφων στον σκληρό δίσκο ή στην εξωτερική συσκευή αποθήκευσης του υπολογιστή σας είναι βολική και ασφαλής. Ωστόσο, πώς κάνετε αλλαγές σε σελίδες που συνήθως παρουσιάζονται ως εικόνα; Θα χρειαστούμε ειδικά προγράμματα, την εγκατάσταση και διαχείριση του οποίου θα περιγράψουμε παρακάτω.

Πώς να σαρώσετε ένα έγγραφο πριν από την επεξεργασία;

Προκειμένου να χειριστείτε με επιτυχία το αρχείο στο μέλλον, είναι σημαντικό να το μετατρέψετε σωστά σε μορφή "εικόνας", καθώς και να λάβετε υπόψη αρκετές απλές αλλά χρήσιμες αποχρώσεις στην ίδια τη διαδικασία. Για αυτό:

  • Λειάνετε όλες τις πτυχές και πτυχές, ώστε να μην εμφανίζονται στη σάρωση και να μην οδηγούν σε δυσκολίες στην αναγνώριση των γραμμάτων.
  • Για ευκολία αναφοράς, αποθηκεύστε το αρχείο σε μορφή PDF, JPG ή TIFF.
  • Το έγγραφο PDF μπορεί να ανοίξει και να επεξεργαστεί Πρόγραμμα Adobe Acrobat (ή οποιοδήποτε άλλο σχεδιασμένο για παρόμοιους σκοπούς).
  • Μεταβείτε στον ιστότοπο της εταιρείας που δημιούργησε τον σαρωτή ή αναζητήστε ένα αποκλειστικό πρόγραμμα στον περιλαμβανόμενο δίσκο (συχνά γνωστές μάρκες έχουν τις δικές τους εφαρμογές για την αλλαγή σαρωμένων σελίδων).
  • Για μεταγενέστερη χρήση του αρχείου στο MS Office 2003 ή 2007, εγκαταστήστε το Βοηθητικό πρόγραμμα της MicrosoftΣάρωση εγγράφων γραφείου. Μετατρέπει αυτόματα το σαρωμένο αρχείο, μετατρέποντάς το απευθείας σε κείμενο (το πρόγραμμα δεν λειτουργεί με πιο πρόσφατες εκδόσεις του Office).
  • Συνιστάται η ασπρόμαυρη σάρωση αντί για έγχρωμη - αυτό διευκολύνει την ανάλυση του κειμένου.
  • Η μορφή TIFF χρησιμοποιείται καλύτερα για μετατροπείς OCR, δηλαδή προγράμματα που εκτελούν οπτική αναγνώριση.

Πώς να επεξεργαστείτε ένα σαρωμένο έγγραφο - εργασία με βοηθητικά προγράμματα OCR

Η αρχή της μεθόδου Optical Character Recognition είναι να διαβάζετε τους χαρακτήρες σε χαρτί και στη συνέχεια να τους συγκρίνετε με στοιχεία από τη δική σας βάση δεδομένων. Με αυτόν τον τρόπο, μια συμπαγής εικόνα μετατρέπεται σε επεξεργάσιμο κείμενο. Ζωντανά παραδείγματα προγραμμάτων που αντιμετωπίζουν αυτήν την εργασία είναι το Adobe Acrobat και το Evernote. Για να κάνετε διορθώσεις σε μια υπάρχουσα σάρωση, απλώς ανοίξτε την με μία από αυτές τις εφαρμογές, ολόκληρη η επόμενη διαδικασία θα πραγματοποιηθεί αυτόματα. Όταν το πρόγραμμα ολοκληρώσει την αναγνώριση, θα ζητήσει από το χρήστη να αποθηκεύσει το έγγραφο σε μία από τις διαθέσιμες μορφές.


Πώς να επεξεργαστείτε ένα σαρωμένο έγγραφο PDF

Εάν το σαρωμένο έγγραφο έχει αποθηκευτεί σε αρχείο PDF, μπορούμε εύκολα να το επεξεργαστούμε στο Acrobat DC. Για αυτό:

  • ανοίξτε το μενού "Εργαλεία" -> "Επεξεργασία PDF";
  • το πρόγραμμα ξεκινά τη διαδικασία επεξεργασίας, εμφανίζοντας ένα μενού υποδείξεων στην επάνω δεξιά γωνία.
  • κάνοντας κλικ σε αυτό και επιλέγοντας "Επιλογές", μπορείτε να καθορίσετε τη γλώσσα αναγνώρισης.
  • Για να κάνετε αλλαγές, απλώς κάντε κλικ σε οποιαδήποτε γραμμή του εγγράφου.
  • ένα έγγραφο που ανοίγει για επεξεργασία μέσω OCR συνοδεύεται από έναν ειδικό πίνακα με ρυθμίσεις που βρίσκονται στη δεξιά πλευρά της οθόνης.
  • Στην ενότητα "Ρυθμίσεις", εκτός από τη γλώσσα, είναι επίσης βολικό να επιλέξετε την εμφανιζόμενη γραμματοσειρά και να επισημάνετε τις σελίδες που πρέπει να επεξεργαστούν (όλες ή μία κάθε φορά).


Υπάρχει μια προσβάσιμη εναλλακτική λύση στα προγράμματα μετατροπέων με δυνατότητα εγκατάστασης στον Παγκόσμιο Ιστό. Αυτά είναι online OCR που μπορούν εύκολα να μετατρέψουν την εικόνα που προκύπτει σε οποιαδήποτε μορφή κειμένου. Για παράδειγμα, ο ιστότοπος pdfonline.com σάς επιτρέπει να δημιουργήσετε ένα κανονικό αρχείο MS Word από ένα σαρωμένο έγγραφο PDF μέσα σε λίγα λεπτά.