FMUSER Wirless Μετάδοση βίντεο και ήχου πιο εύκολα!

[προστασία μέσω email] WhatsApp + 8618078869184
Γλώσσα

    Επεξεργασία ήχου-1 βασικές γνώσεις

     

    Ήχου


    Αναφέρεται στα ηχητικά κύματα με συχνότητα ήχου μεταξύ 20 Hz και 20 kHz που μπορούν να ακουστούν από το ανθρώπινο αυτί.

    Εάν προσθέσετε μια αντίστοιχη κάρτα ήχου στον υπολογιστή—η κάρτα ήχου που λέμε συχνά, μπορούμε να ηχογραφήσουμε όλους τους ήχους και τα ακουστικά χαρακτηριστικά του ήχου, όπως το επίπεδο του ήχου, μπορούν να αποθηκευτούν ως αρχεία στον σκληρό δίσκο του υπολογιστή δίσκος. Αντίθετα, μπορούμε επίσης να χρησιμοποιήσουμε ένα συγκεκριμένο πρόγραμμα ήχου για την αναπαραγωγή του αποθηκευμένου αρχείου ήχου για να επαναφέρουμε τον προηγουμένως εγγεγραμμένο ήχο.

     

    1 Μορφή αρχείου ήχου
    Η μορφή αρχείου ήχου αναφέρεται συγκεκριμένα στη μορφή του αρχείου που αποθηκεύει τα δεδομένα ήχου. Υπάρχουν πολλές διαφορετικές μορφές.

    Η γενική μέθοδος λήψης δεδομένων ήχου είναι η δειγματοληψία (κβαντισμός) της τάσης ήχου σε ένα σταθερό χρονικό διάστημα και η αποθήκευση του αποτελέσματος σε μια συγκεκριμένη ανάλυση (για παράδειγμα, κάθε δείγμα CDDA είναι 16 bit ή 2 byte). Το διάστημα δειγματοληψίας μπορεί να έχει διαφορετικά πρότυπα. Για παράδειγμα, το CDDA χρησιμοποιεί 44,100 φορές ανά δευτερόλεπτο. Το DVD χρησιμοποιεί 48,000 ή 96,000 φορές το δευτερόλεπτο. Επομένως, [ρυθμός δειγματοληψίας], [ανάλυση] και ο αριθμός των [καναλιών] (για παράδειγμα, 2 κανάλια για στερεοφωνικό) είναι οι βασικές παράμετροι της μορφής αρχείου ήχου.

     

    1.1 Απώλειες και χωρίς απώλειες
    Σύμφωνα με τη διαδικασία παραγωγής ψηφιακού ήχου, η κωδικοποίηση ήχου μπορεί να είναι μόνο απείρως κοντά στα φυσικά σήματα. Τουλάχιστον η τρέχουσα τεχνολογία μπορεί να κάνει μόνο αυτό. Οποιοδήποτε σχήμα κωδικοποίησης ψηφιακού ήχου έχει απώλειες επειδή δεν μπορεί να αποκατασταθεί πλήρως. Σε εφαρμογές υπολογιστών, το υψηλότερο επίπεδο πιστότητας είναι η κωδικοποίηση PCM, η οποία χρησιμοποιείται ευρέως για τη διατήρηση υλικού και την εκτίμηση της μουσικής. Χρησιμοποιείται σε CD, DVD και τα κοινά μας αρχεία WAV. Επομένως, το PCM έχει γίνει μια κωδικοποίηση χωρίς απώλειες κατά σύμβαση, επειδή το PCM αντιπροσωπεύει το καλύτερο επίπεδο πιστότητας στον ψηφιακό ήχο.

     

    Υπάρχουν δύο κύριοι τύποι μορφών αρχείων ήχου:

    Μορφές χωρίς απώλειες, όπως WAV, PCM, TTA, FLAC, AU, APE, TAK, WavPack(WV)
    Μορφές με απώλεια, όπως MP3, Windows Media Audio (WMA), Ogg Vorbis (OGG), AAC

     


    Εισαγωγή 2 παραμέτρων


    2.1 Ρυθμός δειγματοληψίας


    Αναφέρεται στον αριθμό των ηχητικών δειγμάτων που λαμβάνονται ανά δευτερόλεπτο. Ο ήχος είναι στην πραγματικότητα ένα είδος ενεργειακού κύματος, οπότε έχει επίσης τα χαρακτηριστικά της συχνότητας και του πλάτους. Η συχνότητα αντιστοιχεί στον άξονα χρόνου και το πλάτος αντιστοιχεί στον άξονα στάθμης. Το κύμα είναι απείρως απαλό και η χορδή μπορεί να θεωρηθεί ότι αποτελείται από αμέτρητα σημεία. Επειδή ο χώρος αποθήκευσης είναι σχετικά περιορισμένος, τα σημεία της συμβολοσειράς πρέπει να λαμβάνονται δείγματα κατά τη διαδικασία ψηφιακής κωδικοποίησης.

     

    Η διαδικασία δειγματοληψίας είναι να εξαγάγετε την τιμή συχνότητας ενός συγκεκριμένου σημείου. Προφανώς, όσο περισσότερα σημεία εξάγονται σε ένα δευτερόλεπτο, τόσο περισσότερες πληροφορίες συχνότητας λαμβάνονται. Για την επαναφορά της κυματομορφής, όσο υψηλότερη είναι η συχνότητα δειγματοληψίας, τόσο καλύτερη είναι η ποιότητα του ήχου. Όσο πιο πραγματική είναι η αποκατάσταση, αλλά ταυτόχρονα καταλαμβάνει περισσότερους πόρους. Λόγω της περιορισμένης ανάλυσης του ανθρώπινου αυτιού, πολύ υψηλή συχνότητα δεν μπορεί να διακριθεί. Η συχνότητα δειγματοληψίας 22050 χρησιμοποιείται συνήθως, το 44100 έχει ήδη ποιότητα ήχου CD και η δειγματοληψία άνω των 48,000 ή 96,000 δεν είναι πλέον σημαντική για το ανθρώπινο αυτί. Αυτό είναι παρόμοιο με τα 24 καρέ ανά δευτερόλεπτο σε ταινίες. Εάν είναι στερεοφωνικό, το δείγμα διπλασιάζεται και το αρχείο σχεδόν διπλασιάζεται.

     

    Σύμφωνα με τη θεωρία δειγματοληψίας Nyquist, προκειμένου να διασφαλιστεί ότι ο ήχος δεν παραμορφώνεται, η συχνότητα δειγματοληψίας θα πρέπει να είναι περίπου 40 kHz. Δεν χρειάζεται να ξέρουμε πώς προέκυψε αυτό το θεώρημα. Χρειάζεται μόνο να γνωρίζουμε ότι αυτό το θεώρημα μας λέει ότι εάν θέλουμε να καταγράψουμε ένα σήμα με ακρίβεια, η συχνότητα δειγματοληψίας μας πρέπει να είναι μεγαλύτερη ή ίση με τη διπλάσια της μέγιστης συχνότητας του σήματος ήχου. Θυμηθείτε, είναι η μέγιστη συχνότητα.

     

    Στον τομέα του ψηφιακού ήχου, οι συχνότητες δειγματοληψίας που χρησιμοποιούνται συνήθως είναι:

    8000 Hz - ο ρυθμός δειγματοληψίας που χρησιμοποιείται από το τηλέφωνο, ο οποίος επαρκεί για την ανθρώπινη ομιλία
    Ρυθμός δειγματοληψίας 11025 Hz που χρησιμοποιείται από το τηλέφωνο
    Ρυθμός δειγματοληψίας 22050 Hz που χρησιμοποιείται σε ραδιοφωνικές εκπομπές
    Ρυθμός δειγματοληψίας 32000 Hz για ψηφιακή βιντεοκάμερα miniDV, DAT (λειτουργία LP)
    CD ήχου 44100 Hz, που χρησιμοποιείται επίσης συνήθως ως ρυθμός δειγματοληψίας για ήχο MPEG-1 (VCD, SVCD, MP3)
    Ποσοστό δειγματοληψίας 47250 Hz που χρησιμοποιείται από εμπορικές συσκευές εγγραφής PCM
    Ρυθμός δειγματοληψίας 48000 Hz για ψηφιακό ήχο που χρησιμοποιείται σε miniDV, ψηφιακή τηλεόραση, DVD, DAT, ταινίες και επαγγελματικό ήχο
    Ποσοστό δειγματοληψίας 50000 Hz που χρησιμοποιείται από εμπορικές ψηφιακές συσκευές εγγραφής
    96000 Hz ή 192000 Hz - ο ρυθμός δειγματοληψίας που χρησιμοποιείται για DVD-Audio, ορισμένα κομμάτια ήχου LPCM DVD, κομμάτια ήχου BD-ROM (Blu-ray Disc) και κομμάτια ήχου HD-DVD (DVD υψηλής ευκρίνειας)


    2.2 Αριθμός bit δειγματοληψίας
    Ο αριθμός των bit δειγματοληψίας ονομάζεται επίσης το μέγεθος δειγματοληψίας ή ο αριθμός των bit ψηφιοποίησης. Είναι μια παράμετρος που χρησιμοποιείται για τη μέτρηση της διακύμανσης του ήχου, δηλαδή της ανάλυσης της κάρτας ήχου ή μπορεί να γίνει κατανοητή ως η ανάλυση της κάρτας ήχου που επεξεργάζεται η κάρτα ήχου. Όσο μεγαλύτερη είναι η τιμή, τόσο υψηλότερη είναι η ανάλυση και τόσο πιο ρεαλιστικός ο ήχος που εγγράφηκε και αναπαράχθηκε. Το bit της κάρτας ήχου αναφέρεται στα δυαδικά ψηφία του ψηφιακού σήματος ήχου που χρησιμοποιείται από την κάρτα ήχου κατά τη συλλογή και την αναπαραγωγή αρχείων ήχου. Το κομμάτι της κάρτας ήχου αντικατοπτρίζει αντικειμενικά την ακρίβεια της περιγραφής του ψηφιακού σήματος ήχου του σήματος ήχου εισόδου. Οι κοινές κάρτες ήχου είναι κυρίως 8-bit και 16-bit. Σήμερα, όλα τα mainstream προϊόντα στην αγορά είναι κάρτες ήχου 16 bit και άνω.

     

    Κάθε δείγμα δειγματοληψίας καταγράφει το πλάτος και η ακρίβεια δειγματοληψίας εξαρτάται από τον αριθμό των bit δειγματοληψίας:

    1 byte (δηλαδή 8 bit) μπορεί να καταγράψει μόνο 256 αριθμούς, πράγμα που σημαίνει ότι το πλάτος μπορεί να διαιρεθεί μόνο σε 256 επίπεδα.
    2 byte (δηλαδή 16 bit) μπορεί να είναι τόσο μικρά όσο 65536, που είναι ήδη ένα πρότυπο CD.
    4 bytes (δηλαδή 32bit) μπορούν να υποδιαιρέσουν το πλάτος σε επίπεδα 4294967296, πράγμα που είναι πραγματικά περιττό.
    2.3 Αριθμός καναλιών
    Δηλαδή τον αριθμό των καναλιών ήχου. Τα κοινά μονοφωνικά και στερεοφωνικά (δικαναλικά) έχουν πλέον εξελιχθεί σε κανάλια surround τεσσάρων ήχων (τεσσάρων καναλιών) και 5.1 καναλιών.

     

    2.3.1 Μονο
    Το Mono είναι μια σχετικά πρωτόγονη μορφή αναπαραγωγής ήχου και οι πρώτες κάρτες ήχου το χρησιμοποιούσαν πιο συχνά. Ο μονοφωνικός ήχος μπορεί να ακουστεί μόνο με ένα ηχείο και μερικά επεξεργάζονται επίσης σε δύο ηχεία για την έξοδο του ίδιου καναλιού ήχου. Όταν αναπαράγονται μονοφωνικές πληροφορίες μέσω δύο ηχείων, μπορούμε καθαρά να νιώσουμε ότι ο ήχος προέρχεται από δύο ηχεία. Είναι αδύνατο να προσδιοριστεί η συγκεκριμένη θέση της πηγής ήχου που μεταδίδεται στα αυτιά μας από τη μέση του ηχείου.

     

    2.3.2 Στερεοφωνικό
    Τα διφωνικά κανάλια έχουν δύο κανάλια ήχου. Η αρχή είναι ότι όταν οι άνθρωποι ακούν έναν ήχο, μπορούν να κρίνουν τη συγκεκριμένη θέση της πηγής ήχου με βάση τη διαφορά φάσης μεταξύ του αριστερού και του δεξιού αυτιού. Ο ήχος εκχωρείται σε δύο ανεξάρτητα κανάλια κατά τη διάρκεια της διαδικασίας εγγραφής, έτσι ώστε να επιτευχθεί ένα καλό εφέ εντοπισμού του ήχου. Αυτή η τεχνική είναι ιδιαίτερα χρήσιμη στην εκτίμηση της μουσικής. Ο ακροατής μπορεί να διακρίνει ξεκάθαρα την κατεύθυνση από την οποία προέρχονται διάφορα όργανα, γεγονός που κάνει τη μουσική πιο ευφάνταστη και πιο κοντά στην εμπειρία του χώρου.

     

    Δύο φωνές είναι αυτή τη στιγμή οι πιο συχνά χρησιμοποιούμενες. Στο καραόκε, το ένα είναι για να παίζει μουσική και το άλλο για τη φωνή του τραγουδιστή. σε VCD, το ένα κάνει μεταγλώττιση στα Mandarin και το άλλο στα καντονέζικα.

     

    2.3.3 Τετράχρωμος surround
    Το surround τεσσάρων καναλιών ορίζει τέσσερα σημεία ήχου, εμπρός αριστερά, εμπρός δεξιά, πίσω αριστερά και πίσω δεξιά, και το κοινό περιβάλλεται από αυτά. Συνιστάται επίσης η προσθήκη ενός υπογούφερ για την ενίσχυση της επεξεργασίας αναπαραγωγής σημάτων χαμηλής συχνότητας (αυτός είναι ο λόγος που τα συστήματα ηχείων 4.1 καναλιών είναι ευρέως δημοφιλή σήμερα). Όσον αφορά το συνολικό αποτέλεσμα, το σύστημα τεσσάρων καναλιών μπορεί να φέρει στους ακροατές surround ήχο από πολλές διαφορετικές κατευθύνσεις, μπορεί να αποκτήσει την ακουστική εμπειρία του να βρίσκεται σε μια ποικιλία διαφορετικών περιβαλλόντων και να προσφέρει στους χρήστες μια ολοκαίνουργια εμπειρία. Σήμερα, η τεχνολογία τεσσάρων καναλιών έχει ενσωματωθεί ευρέως στη σχεδίαση διαφόρων καρτών ήχου μεσαίας έως υψηλής ποιότητας, καθιστώντας την κύρια τάση της μελλοντικής ανάπτυξης.

     

    2.3.4 5.1 κανάλι
    5.1 κανάλια έχουν χρησιμοποιηθεί ευρέως σε διάφορα παραδοσιακά θέατρα και οικιακά θέατρα. Μερικές από τις πιο γνωστές μορφές συμπίεσης ηχογράφησης, όπως Dolby AC-3 (Dolby Digital), DTS κ.λπ., βασίζονται στο σύστημα ήχου 5.1. Το κανάλι ".1" είναι ένα ειδικά σχεδιασμένο κανάλι υπογούφερ που μπορεί να παράγει υπογούφερ με εύρος απόκρισης συχνότητας 20 έως 120 Hz. Στην πραγματικότητα, το σύστημα ήχου 5.1 προέρχεται από 4.1 surround, η διαφορά είναι ότι προσθέτει μια κεντρική μονάδα. Αυτή η κεντρική μονάδα είναι υπεύθυνη για τη μετάδοση του ηχητικού σήματος κάτω των 80Hz, το οποίο είναι χρήσιμο για την ενίσχυση της ανθρώπινης φωνής κατά την παρακολούθηση της ταινίας και για τη συγκέντρωση του διαλόγου στη μέση ολόκληρου του ηχητικού πεδίου για αύξηση του συνολικού εφέ.

     

    Προς το παρόν, πολλές διαδικτυακές συσκευές αναπαραγωγής μουσικής, όπως η QQ Music, παρείχαν μουσική 5.1 καναλιών για δοκιμαστική ακρόαση και λήψη.

     

    2.4 Frame
    Η έννοια των καρέ ήχου δεν είναι τόσο σαφής όσο τα καρέ βίντεο. Σχεδόν όλες οι μορφές κωδικοποίησης βίντεο μπορούν απλώς να θεωρήσουν ένα πλαίσιο ως κωδικοποιημένη εικόνα. Ωστόσο, το πλαίσιο ήχου σχετίζεται με τη μορφή κωδικοποίησης, η οποία υλοποιείται από κάθε πρότυπο κωδικοποίησης.

     

    Για παράδειγμα, στην περίπτωση του PCM (μη κωδικοποιημένα δεδομένα ήχου), δεν χρειάζεται καθόλου την έννοια των καρέ και μπορεί να αναπαραχθεί σύμφωνα με το ρυθμό δειγματοληψίας και την ακρίβεια δειγματοληψίας. Για παράδειγμα, για διπλό ήχο με ρυθμό δειγματοληψίας 44.1 kHZ και ακρίβεια δειγματοληψίας 16 bit, μπορείτε να υπολογίσετε ότι ο ρυθμός bit είναι 44100162 bps και τα δεδομένα ήχου ανά δευτερόλεπτο είναι σταθερά 44100162/8 byte.

     

    Το πλαίσιο amr είναι σχετικά απλό. Ορίζει ότι κάθε 20 ms ήχου είναι ένα καρέ και κάθε καρέ ήχου είναι ανεξάρτητο και είναι δυνατή η χρήση διαφορετικών αλγορίθμων κωδικοποίησης και διαφορετικών παραμέτρων κωδικοποίησης.

     

    Το πλαίσιο mp3 είναι λίγο πιο περίπλοκο και περιέχει περισσότερες πληροφορίες, όπως ρυθμό δειγματοληψίας, ρυθμό bit και διάφορες παραμέτρους.

     

    2.5 κύκλους
    Ο αριθμός των καρέ που απαιτούνται από μια συσκευή ήχου για επεξεργασία κάθε φορά και η πρόσβαση δεδομένων της συσκευής ήχου και η αποθήκευση δεδομένων ήχου βασίζονται όλα σε αυτήν τη μονάδα.

     

    2.6 Λειτουργία παρεμβολής
    Η μέθοδος αποθήκευσης ψηφιακού σήματος ήχου. Τα δεδομένα αποθηκεύονται σε συνεχή πλαίσια, δηλαδή, πρώτα καταγράφονται τα δείγματα του αριστερού καναλιού και τα δείγματα του δεξιού καναλιού του πλαισίου 1 και στη συνέχεια ξεκινά η εγγραφή του πλαισίου 2.

     

    2.7 Λειτουργία χωρίς διαπλοκή
    Πρώτα, καταγράψτε τα δείγματα του αριστερού καναλιού όλων των καρέ σε μια περίοδο και μετά καταγράψτε όλα τα σωστά δείγματα καναλιών.

     

    2.8 bit rate (bit rate)
    Ο ρυθμός bit ονομάζεται επίσης ρυθμός bit, ο οποίος αναφέρεται στην ποσότητα των δεδομένων που παίζονται από τη μουσική ανά δευτερόλεπτο. Η μονάδα εκφράζεται με bit, το οποίο είναι δυαδικό bit. bps είναι ο ρυθμός bit. Το b είναι bit (bit), το s είναι το δεύτερο (δεύτερο), το p είναι κάθε (per), ένα byte ισοδυναμεί με 8 δυαδικά bit. Δηλαδή, το μέγεθος αρχείου ενός τραγουδιού 4 λεπτών 128 bps υπολογίζεται έτσι (128/8)460=3840kB=3.8MB, 1B (Byte)=8b (bit), γενικά το mp3 είναι ωφέλιμο στα 128 bit περίπου ρυθμός, και είναι πιθανώς Το μέγεθος είναι περίπου 3-4 BM.

     

    Σε εφαρμογές υπολογιστών, το υψηλότερο επίπεδο πιστότητας είναι η κωδικοποίηση PCM, η οποία χρησιμοποιείται ευρέως για διατήρηση υλικού και μουσική εκτίμηση. Όλα χρησιμοποιούνται CD, DVD και τα κοινά μας αρχεία WAV. Επομένως, το PCM έχει γίνει μια κωδικοποίηση χωρίς απώλειες κατά σύμβαση, επειδή το PCM αντιπροσωπεύει το καλύτερο επίπεδο πιστότητας στον ψηφιακό ήχο. Δεν σημαίνει ότι το PCM μπορεί να εξασφαλίσει την απόλυτη πιστότητα του σήματος. Το PCM μπορεί να επιτύχει μόνο τη μέγιστη άπειρη εγγύτητα.

     

    Ο υπολογισμός του ρυθμού bit μιας ροής ήχου PCM είναι μια πολύ εύκολη εργασία, τιμή ρυθμού δειγματοληψίας × τιμή μεγέθους δειγματοληψίας × αριθμός καναλιού bps. Ένα αρχείο WAV με ρυθμό δειγματοληψίας 44.1 KHz, μέγεθος δειγματοληψίας 16 bit και κωδικοποίηση PCM διπλού καναλιού, ο ρυθμός δεδομένων του είναι 44.1 K×16×2 = 1411.2 Kbps. Το κοινό μας CD ήχου χρησιμοποιεί κωδικοποίηση PCM και η χωρητικότητα ενός CD μπορεί να χωρέσει μόνο 72 λεπτά μουσικών πληροφοριών.

     

    Ένα κωδικοποιημένο σήμα ήχου διπλού καναλιού PCM απαιτεί χώρο 176.4KB σε 1 δευτερόλεπτο και περίπου 10.34M σε 1 λεπτό. Αυτό είναι απαράδεκτο για τους περισσότερους χρήστες, ειδικά για εκείνους που τους αρέσει να ακούνε μουσική στον υπολογιστή. Πληρότητα δίσκου, υπάρχουν μόνο δύο μέθοδοι, δείκτης δειγματοληψίας ή συμπίεση. Δεν συνιστάται η μείωση του δείκτη δειγματοληψίας, έτσι οι ειδικοί έχουν αναπτύξει διάφορα σχήματα συμπίεσης. Τα πιο πρωτότυπα είναι DPCM, ADPCM και το πιο διάσημο είναι MP3. Επομένως, ο ρυθμός κωδικού μετά τη συμπίεση δεδομένων είναι πολύ χαμηλότερος από τον αρχικό κώδικα.

     

    2.9 Παράδειγμα υπολογισμού
    Για παράδειγμα, το μήκος αρχείου του "Windows XP startup.wav" είναι 424,644 byte, το οποίο έχει τη μορφή "22050HZ / 16bit / stereo".

    Τότε ο ρυθμός μετάδοσής του ανά δευτερόλεπτο (ρυθμός bit, που ονομάζεται επίσης ρυθμός bit, ρυθμός δειγματοληψίας) είναι 22050162 = 705600 (bps), που μετατρέπεται σε μονάδα byte είναι 705600/8 = 88200 (byte ανά δευτερόλεπτο), χρόνος αναπαραγωγής: 424644 (Σύνολο byte) / 88200 (byte ανά δευτερόλεπτο) ≈ 4.8145578 (δευτερόλεπτα).

     

    Αλλά αυτό δεν είναι αρκετά ακριβές. Το αρχείο WAVE (*.wav) στην τυπική μορφή PCM έχει τουλάχιστον 42 byte πληροφοριών κεφαλίδας, οι οποίες θα πρέπει να αφαιρεθούν κατά τον υπολογισμό του χρόνου αναπαραγωγής, επομένως υπάρχει: (424644-42) / (22050162/8) ≈ 4.8140816 ( δευτερόλεπτα). Αυτό είναι πιο ακριβές.

     

    3 Κωδικοποίηση ήχου PCM
    Το PCM σημαίνει Pulse Code Modulation. Στη διαδικασία PCM, το αναλογικό σήμα εισόδου δειγματοληπτείται, κβαντοποιείται και κωδικοποιείται και ο δυαδικός κωδικοποιημένος αριθμός αντιπροσωπεύει το πλάτος του αναλογικού σήματος. Το άκρο λήψης επαναφέρει στη συνέχεια αυτούς τους κωδικούς στο αρχικό αναλογικό σήμα. Δηλαδή, η A/D μετατροπή ψηφιακού ήχου περιλαμβάνει τρεις διαδικασίες: δειγματοληψία, κβαντοποίηση και κωδικοποίηση.

     

    Ο ρυθμός υιοθέτησης του φωνητικού PCM είναι 8 kHz και ο αριθμός των bit δειγματοληψίας είναι 8 bit, επομένως ο ρυθμός κωδικοποίησης του ψηφιακού κωδικοποιημένου σήματος φωνής είναι 8 bits×8kHz=64kbps=8KB/s.

     

    3.1 Αρχές κωδικοποίησης ήχου
    Όποιος έχει μια συγκεκριμένη ηλεκτρονική βάση γνωρίζει ότι το ηχητικό σήμα που συλλέγει ο αισθητήρας είναι μια αναλογική ποσότητα, αλλά αυτό που χρησιμοποιούμε στην πραγματική διαδικασία μετάδοσης είναι μια ψηφιακή ποσότητα. Και αυτό περιλαμβάνει τη διαδικασία μετατροπής αναλογικού σε ψηφιακό. Το αναλογικό σήμα πρέπει να περάσει από τρεις διαδικασίες, δηλαδή δειγματοληψία, κβαντοποίηση και κωδικοποίηση, για να πραγματοποιήσει την τεχνολογία διαμόρφωσης κωδικού παλμού (PCM, Pulse Coding Modulation) της ψηφιοποίησης φωνής.

     

    Διαδικασία μετατροπής


    3.1.1 Δειγματοληψία
    Η δειγματοληψία είναι η διαδικασία εξαγωγής δειγμάτων (ρυθμός δειγματοληψίας) από ένα αναλογικό σήμα σε συχνότητα που είναι μεγαλύτερη από 2 φορές το εύρος ζώνης του σήματος (Θεώρημα δειγματοληψίας Lequist) και μετατροπή του σε διακριτό σήμα δειγματοληψίας στον άξονα του χρόνου.
    Ρυθμός δειγματοληψίας: Ο αριθμός των δειγμάτων που εξάγονται από ένα συνεχές σήμα ανά δευτερόλεπτο για να σχηματιστεί ένα διακριτό σήμα, εκφρασμένο σε Hertz (Hz).


    δείγμα:
    Για παράδειγμα, ο ρυθμός δειγματοληψίας σήματος ήχου είναι 8000 Hz.
    Μπορεί να γίνει κατανοητό ότι το δείγμα στο παραπάνω σχήμα αντιστοιχεί στην καμπύλη της αλλαγής τάσης με το χρόνο στο σχήμα για 1 δευτερόλεπτο, μετά το χαμηλότερο 1 2 3… 10, επειδή θα πρέπει να υπάρχουν 1-8000 σημεία, δηλαδή 1 Το δεύτερο χωρίζεται σε 8000 μέρη, και στη συνέχεια βγάλτε τα με τη σειρά. Η τιμή τάσης που αντιστοιχεί σε αυτό το χρόνο 8000 σημείων.

     

    3.1.2 Ποσοτικοποίηση
    Αν και το σήμα του δείγματος είναι ένα διακριτό σήμα στον άξονα του χρόνου, εξακολουθεί να είναι ένα αναλογικό σήμα και η τιμή του δείγματός του μπορεί να έχει άπειρο αριθμό τιμών μέσα σε ένα συγκεκριμένο εύρος τιμών. Η μέθοδος "στρογγυλοποίησης" πρέπει να υιοθετηθεί για να "στρογγυλοποιηθεί" οι τιμές του δείγματος, έτσι ώστε οι τιμές του δείγματος εντός ενός συγκεκριμένου εύρους τιμών να αλλάξουν από άπειρο αριθμό τιμών σε πεπερασμένο αριθμό τιμών. Αυτή η διαδικασία ονομάζεται ποσοτικοποίηση.

     

    Αριθμός δειγματοληψίας bit: αναφέρεται στον αριθμό των bit που χρησιμοποιούνται για την περιγραφή του ψηφιακού σήματος.
    8 bit (8bit) αντιπροσωπεύουν 2 στην 8η ισχύ=256, 16 bit (16bit) αντιπροσωπεύουν 2 έως 16η ισχύ=65536.

     

    δείγμα:
    Για παράδειγμα, το εύρος τάσης που συλλέγεται από τον αισθητήρα ήχου είναι 0-3.3 V και ο αριθμός δειγματοληψίας είναι 8 bit (bit)
    Δηλαδή, θεωρούμε 3.3V/ 2^8 = 0.0128 ως την ακρίβεια κβαντισμού.
    Διαιρούμε τα 3.3v σε 0.0128 ως τον άξονα Υ, όπως φαίνεται στο Σχήμα 3, το 1 2… 8 γίνεται 0 0.0128 0.0256… 3.3 V
    Για παράδειγμα, η τιμή τάσης ενός σημείου δειγματοληψίας είναι 1.652 V (μεταξύ 1280.128 και 1290.128). Το στρογγυλοποιούμε στα 1.65 V και το αντίστοιχο επίπεδο κβαντισμού είναι 128.

     

    3.1.3 Κωδικοποίηση
    Το κβαντοποιημένο σήμα δειγματοληψίας μετατρέπεται σε μια σειρά δεκαδικών ροών ψηφιακού κώδικα που διατάσσονται σύμφωνα με την ακολουθία δειγματοληψίας, δηλαδή το δεκαδικό ψηφιακό σήμα. Ένα απλό και αποτελεσματικό σύστημα δεδομένων είναι ένα σύστημα δυαδικού κώδικα. Επομένως, ο δεκαδικός ψηφιακός κωδικός θα πρέπει να μετατραπεί σε δυαδικό κωδικό. Σύμφωνα με τον συνολικό αριθμό των δεκαδικών ψηφιακών κωδικών, μπορεί να προσδιοριστεί ο αριθμός των bits που απαιτούνται για τη δυαδική κωδικοποίηση, δηλαδή το μήκος λέξης (αριθμός bit δειγματοληψίας). Αυτή η διαδικασία μετατροπής του κβαντισμένου σήματος δείγματος σε μια ροή δυαδικού κώδικα με δεδομένο μήκος λέξης ονομάζεται κωδικοποίηση.

     

    δείγμα:
    Τότε το παραπάνω 1.65V αντιστοιχεί σε επίπεδο κβαντισμού 128. Το αντίστοιχο δυαδικό σύστημα είναι 10000000. Δηλαδή το αποτέλεσμα της κωδικοποίησης του σημείου δειγματοληψίας είναι 10000000. Φυσικά, πρόκειται για μέθοδο κωδικοποίησης που δεν λαμβάνει υπόψη τις θετικές και αρνητικές τιμές , και υπάρχουν πολλοί τύποι μεθόδων κωδικοποίησης που απαιτούν ειδική ανάλυση συγκεκριμένων ζητημάτων. (Η κωδικοποίηση μορφής ήχου PCM είναι κωδικοποίηση πολυγραμμών A-law 13)

     

    3.2 Κωδικοποίηση ήχου PCM
    Το σήμα PCM δεν έχει υποστεί καμία κωδικοποίηση και συμπίεση (συμπίεση χωρίς απώλειες). Σε σύγκριση με τα αναλογικά σήματα, δεν επηρεάζεται εύκολα από την ακαταστασία και την παραμόρφωση του συστήματος μετάδοσης. Το δυναμικό εύρος είναι μεγάλο και η ποιότητα ήχου είναι αρκετά καλή.

     

    3.2.1 Κωδικοποίηση PCM
    Η κωδικοποίηση που χρησιμοποιείται είναι η κωδικοποίηση πολυγραμμών A-law 13.
    Για λεπτομέρειες, ανατρέξτε στο: Κωδικοποίηση φωνής PCM

     

    3.2.2 Κανάλι
    Τα κανάλια μπορούν να χωριστούν σε μονοφωνικά και στερεοφωνικά (διπλά κανάλια).

    Κάθε τιμή δείγματος του PCM περιέχεται σε έναν ακέραιο αριθμό i και το μήκος του i είναι ο ελάχιστος αριθμός byte που απαιτείται για να χωρέσει το καθορισμένο μήκος δείγματος.

     

    Μέγεθος δείγματος Μορφή δεδομένων Ελάχιστη τιμή Μέγιστη τιμή
    PCM 8-bit χωρίς υπογραφή int 0 225
    16-bit PCM int -32767 32767

     

    Για μονοφωνικά αρχεία ήχου, τα δεδομένα δειγματοληψίας είναι ένας σύντομος ακέραιος αριθμός 8 bit (short int 00H-FFH) και τα δεδομένα δειγματοληψίας αποθηκεύονται με χρονολογική σειρά.


    Αρχείο στερεοφωνικού ήχου δύο καναλιών, κάθε δειγματοληψία δεδομένων είναι ένας ακέραιος αριθμός 16 bit (int), τα επάνω οκτώ bit (αριστερό κανάλι) και τα κάτω οκτώ bit (δεξιό κανάλι) αντιπροσωπεύουν αντίστοιχα δύο κανάλια και τα δεδομένα δειγματοληψίας είναι με χρονολογική σειρά Κατάθεση με εναλλακτική σειρά.
    Το ίδιο ισχύει όταν ο αριθμός των bit δειγματοληψίας είναι 16 bit και η αποθήκευση σχετίζεται με τη σειρά των byte.


    Μορφή δεδομένων PCM
    Όλα τα πρωτόκολλα δικτύου χρησιμοποιούν τον μεγάλο endian τρόπο για τη μετάδοση δεδομένων. Επομένως, η μέθοδος big endian ονομάζεται επίσης σειρά byte δικτύου. Όταν δύο κεντρικοί υπολογιστές με διαφορετική σειρά byte επικοινωνούν, πρέπει να μετατραπούν σε σειρά byte δικτύου πριν από την αποστολή δεδομένων πριν από τη μετάδοση.

     

    4 Γ.711
    Γενικά, το PCM, το αναλογικό σήμα υφίσταται κάποια επεξεργασία (όπως συμπίεση πλάτους) πριν ψηφιοποιηθεί. Μόλις ψηφιοποιηθεί, το σήμα PCM συνήθως υποβάλλεται σε περαιτέρω επεξεργασία (όπως συμπίεση ψηφιακών δεδομένων).

     

    Ο G.711 είναι ένας τυπικός αλγόριθμος ψηφιακού σήματος πολυμέσων (συμπίεση/αποσυμπίεση) που mαποδίδει τον κωδικό παλμού από το ITU-T. Είναι μια τεχνική δειγματοληψίας για την ψηφιοποίηση αναλογικών σημάτων, ειδικά για σήματα ήχου. Το PCM λαμβάνει δείγματα του σήματος 8000 φορές ανά δευτερόλεπτο, 8KHz. κάθε δείγμα είναι 8 bit, συνολικά 64 Kbps (DS0). Υπάρχουν δύο πρότυπα για την κωδικοποίηση των επιπέδων δειγματοληψίας. Η Βόρεια Αμερική και η Ιαπωνία χρησιμοποιούν το πρότυπο Mu-Law, ενώ οι περισσότερες άλλες χώρες χρησιμοποιούν το πρότυπο A-Law.

     

    Το A-law και το u-law είναι δύο μέθοδοι κωδικοποίησης του PCM. Το A-law PCM χρησιμοποιείται στην Ευρώπη και τη χώρα μου και το Mu-law χρησιμοποιείται στη Βόρεια Αμερική και την Ιαπωνία. Η διαφορά μεταξύ των δύο είναι η μέθοδος κβαντοποίησης. Ο νόμος Α χρησιμοποιεί κβαντισμό 12 bit και ο νόμος u χρησιμοποιεί κβαντισμό 13 bit. Η συχνότητα δειγματοληψίας είναι 8KHz, και οι δύο είναι μέθοδοι κωδικοποίησης 8 bit.

     

    Απλή κατανόηση: Το PCM είναι τα αρχικά δεδομένα ήχου που συλλέγονται από εξοπλισμό ήχου. Οι G.711 και AAC είναι δύο διαφορετικοί αλγόριθμοι, οι οποίοι μπορούν να συμπιέσουν δεδομένα PCM σε μια συγκεκριμένη αναλογία, εξοικονομώντας έτσι εύρος ζώνης στη μετάδοση δικτύου.

     

     

     

     

    Εμφάνισε όλα τα Ερώτηση

    Ψευδώνυμο

    Ηλεκτρονική Διεύθυνση (Email)

    Ερωτήσεις

    άλλο προϊόν μας:

    Πακέτο επαγγελματικού ραδιοφωνικού σταθμού FM

     



     

    Λύση ξενοδοχείου IPTV

     


      Εισαγάγετε email για να εκπλήξετε

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> Αφρικανικά
      sq.fmuser.org -> Αλβανικά
      ar.fmuser.org -> Αραβικά
      hy.fmuser.org -> Αρμενίων
      az.fmuser.org -> Αζερμπαϊτζάν
      eu.fmuser.org -> Βάσκων
      be.fmuser.org -> Λευκορωσικά
      bg.fmuser.org -> Βουλγαρικά
      ca.fmuser.org -> Καταλανικά
      zh-CN.fmuser.org -> Κινέζικα (απλοποιημένα)
      zh-TW.fmuser.org -> Κινέζικα (Παραδοσιακά)
      hr.fmuser.org -> Κροατικά
      cs.fmuser.org -> Τσέχικα
      da.fmuser.org -> Δανικά
      nl.fmuser.org -> Ολλανδικά
      et.fmuser.org -> Εσθονικά
      tl.fmuser.org -> Φιλιππινέζικα
      fi.fmuser.org -> Φινλανδικά
      fr.fmuser.org -> Γαλλικά
      gl.fmuser.org -> Γαλικιανά
      ka.fmuser.org -> Γεωργιανά
      de.fmuser.org -> Γερμανικά
      el.fmuser.org -> Ελληνική
      ht.fmuser.org -> Κρεόλ της Αϊτής
      iw.fmuser.org -> Εβραϊκά
      hi.fmuser.org -> Χίντι
      hu.fmuser.org -> Ουγγρική
      is.fmuser.org -> Ισλανδικά
      id.fmuser.org -> Ινδονησιακά
      ga.fmuser.org -> Ιρλανδικά
      it.fmuser.org -> Ιταλικά
      ja.fmuser.org -> Ιαπωνικά
      ko.fmuser.org -> Κορεάτικα
      lv.fmuser.org -> Λετονικά
      lt.fmuser.org -> Λιθουανικά
      mk.fmuser.org -> Μακεδόνας
      ms.fmuser.org -> Μαλαισιανά
      mt.fmuser.org -> Μαλτέζικα
      no.fmuser.org -> Νορβηγική
      fa.fmuser.org -> Περσικά
      pl.fmuser.org -> Πολωνικά
      pt.fmuser.org -> Πορτογαλικά
      ro.fmuser.org -> Ρουμανικά
      ru.fmuser.org -> Ρωσικά
      sr.fmuser.org -> Σέρβικα
      sk.fmuser.org -> Σλοβακικά
      sl.fmuser.org -> Σλοβένικα
      es.fmuser.org -> Ισπανικά
      sw.fmuser.org -> Σουαχίλι
      sv.fmuser.org -> Σουηδικά
      th.fmuser.org -> Ταϊλάνδης
      tr.fmuser.org -> Τουρκικά
      uk.fmuser.org -> Ουκρανικά
      ur.fmuser.org -> Ουρντού
      vi.fmuser.org -> Βιετνάμ
      cy.fmuser.org -> Ουαλικά
      yi.fmuser.org -> Γίντις

       
  •  

    FMUSER Wirless Μετάδοση βίντεο και ήχου πιο εύκολα!

  • Επικοινωνία

    Διεύθυνση:
    No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Κίνα 510620

    ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ:
    [προστασία μέσω email]

    Τηλ / WhatApps:
    + 8618078869184

  • Κατηγορίες

  • Newsletter

    ΠΡΩΤΟ Ή ΠΛΗΡΕΣ ΟΝΟΜΑ

    Ε-mail

  • λύση paypal  Western UnionΤράπεζα της Κίνας
    ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ:[προστασία μέσω email]   WhatsApp: +8618078869184 Skype: sky198710021 Συνομίλησε μαζί μου
    Copyright 2006 2020-Powered By www.fmuser.org

    Επικοινωνία