Τεχνητή νοημοσύνη: Το «Instagram της μουσικής» και η εξάπλωση της K-pop σε 6 διαφορετικές γλώσσες

Το στούντιο των BTS χρησιμοποιεί την AI για να συνδυάσει τη φωνή ενός Νοτιοκορεάτη τραγουδιστή με εκείνες των φυσικών ομιλητών πέντε άλλων γλωσσών.

Το μεγαλύτερο στούντιο παραγωγής στον κλάδο της K-pop έχει αρχίσει να χρησιμοποιεί την τεχνητή νοημοσύνη (AI) ώστε να διαδώσει την εν λόγω κορεατική μουσική στον υπόλοιπο κόσμο, προσδοκώντας σε σημαντική ενίσχυση της αναγνωρισιμότητας της ίδιας αλλά και της συγκεκριμένης μουσικής σκηνής.

Σύμφωνα με το Reuters, η HYBE -το στούντιο που του δημοφιλέστατου παγκοσμίως boy band BTS- χρησιμοποιεί την τεχνητή νοημοσύνη για να συνδυάσει τη φωνή ενός Νοτιοκορεάτη τραγουδιστή με εκείνες των φυσικών ομιλητών πέντε άλλων γλωσσών.

Η AI επέτρεψε στην HYBE, τη μεγαλύτερη μουσική εταιρεία της Νότιας Κορέας, να κυκλοφορήσει τον Μάιο ένα κομμάτι του τραγουδιστή MIDNATT σε έξι γλώσσες, κορεάτικα, αγγλικά, ισπανικά, κινέζικα, ιαπωνικά και βιετναμέζικα.

Ορισμένοι τραγουδιστές της K-pop έχουν κυκλοφορήσει τραγούδια στα αγγλικά και τα ιαπωνικά εκτός από τη μητρική τους κορεατική γλώσσα, αλλά η εφαρμογή της νέας τεχνολογίας για ταυτόχρονη κυκλοφορία σε έξι γλώσσες αποτελεί παγκόσμια πρωτοτυπία, σύμφωνα με την HYBE, και θα μπορούσε να ανοίξει το δρόμο για τη χρήση της από περισσότερα δημοφιλή συγκροτήματα.

«Θα ακούσουμε πρώτα την αντίδραση, τη φωνή των οπαδών, και μετά θα αποφασίσουμε ποια θα είναι τα επόμενα βήματά μας», δήλωσε ο Τσανγκ Γουγιόντκ, επικεφαλής του κλάδου διαδραστικών μέσων της HYBE σε συνέντευξη στο στούντιο της εταιρείας.

Ο 40χρονος Λι Γιοόυν, γνωστός ως MIDNATT, ο οποίος μιλάει ελάχιστα αγγλικά και κινέζικα εκτός από κορεάτικα, ηχογράφησε το τραγούδι «Masquerade» σε κάθε γλώσσα.

Το τραγούδι είναι το πιο πρόσφατο σημάδι της αυξανόμενης επιρροής της τεχνητής νοημοσύνης στη μουσική βιομηχανία, σε μια εποχή που τα βραβεία Grammy εισήγαγαν νέους κανόνες για τη χρήση της τεχνολογίας και τα mash-ups τραγουδιών που δημιουργούνται από τεχνητή νοημοσύνη κατακλύζουν τα μέσα κοινωνικής δικτύωσης.

Πως λειτουργεί η διαδικασία

Οι φυσικοί ομιλητές διάβασαν τους στίχους και αργότερα τα δύο συνδυάστηκαν απρόσκοπτα με τη βοήθεια της εσωτερικής μουσικής τεχνολογίας AI της HYBE.

«Χωρίσαμε ένα κομμάτι ήχου σε διαφορετικά συστατικά - προφορά, ηχόχρωμα, ύψος και ένταση. Εξετάσαμε την προφορά που σχετίζεται με την κίνηση της γλώσσας και χρησιμοποιήσαμε τη φαντασία μας για να δούμε τι είδους αποτέλεσμα θα μπορούσαμε να φτιάξουμε χρησιμοποιώντας την τεχνολογία μας» σύμφωνα με τον ίδιο

Σε μια σύγκριση πριν και μετά που παρουσιάστηκε στο Reuters, ένας επιμηκυμένος φθόγγος προστέθηκε στη λέξη «twisted» στους αγγλικούς στίχους, για παράδειγμα, για να ακούγεται πιο φυσικός, ενώ δεν έγινε καμία ανιχνεύσιμη αλλαγή στη φωνή του τραγουδιστή.

Κομμωτής σκύλων έβγαλε 1,2 εκατ. ευρώ το 2022: «Είναι όνειρο ζωής»

Η... NANSY της Superstone

Η χρήση της βαθιάς μάθησης που τροφοδοτείται από το πλαίσιο νευρωνικής ανάλυσης και σύνθεσης (NANSY) που αναπτύχθηκε από την Supertone κάνει το τραγούδι να ακούγεται πιο φυσικό σε σχέση με τη χρήση λογισμικού χωρίς τεχνητή νοημοσύνη, δήλωσε ο διευθύνων σύμβουλος της Supertone, Τσόι Χι-ντου.

Η HYBE ανακοίνωσε τον Ιανουάριο την εξαγορά της Supertone ύψους 45 δισ.ν γουόν (36 εκατ). Η HYBE δήλωσε ότι σκοπεύει να καταστήσει μέρος της τεχνολογίας AI που χρησιμοποιείται στο τραγούδι της MIDNATT προσβάσιμο στους δημιουργούς και το κοινό, αλλά δεν διευκρίνισε αν θα χρεώνει αμοιβές.

Ο MIDNATT δήλωσε ότι η χρήση της τεχνητής νοημοσύνης του επέτρεψε ένα «ευρύτερο φάσμα καλλιτεχνικών εκφράσεων. Αισθάνομαι ότι το γλωσσικό εμπόδιο έχει αρθεί και είναι πολύ πιο εύκολο για τους παγκόσμιους θαυμαστές να έχουν μια καθηλωτική εμπειρία με τη μουσική μου» σημείωσε ο καλλιτέχνης.

Το «Instagram» της μουσικής

Αν και η τεχνολογία δεν είναι νέα, είναι ένας καινοτόμος τρόπος χρήσης της τεχνητής νοημοσύνης στη μουσική, δήλωσε ο Βαλέριο Βελάρδο, διευθυντής της The Sound of AI, μιας συμβουλευτικής υπηρεσίας για την τεχνητή νοημοσύνη στη μουσική και τον ήχο με έδρα την Ισπανία.

Όχι μόνο οι επαγγελματίες μουσικοί, αλλά και ένας ευρύτερος πληθυσμός θα επωφεληθεί μακροπρόθεσμα από τη μουσική τεχνολογία AI, δήλωσε ο Βελάρδο.

«Θα μειώσει το φράγμα της μουσικής δημιουργίας. Είναι λίγο σαν το Instagram για φωτογραφίες, αλλά στην περίπτωση της μουσικής» υποστήριξε ο Ισπανός

Προς το παρόν, η τεχνολογία διόρθωσης προφοράς του HYBE χρειάζεται «εβδομάδες ή μήνες» για να κάνει τη δουλειά της, αλλά όταν η διαδικασία επιταχυνθεί, θα μπορούσε να εξυπηρετήσει ένα ευρύτερο φάσμα σκοπών, όπως η διερμηνεία σε βιντεοδιασκέψεις, δήλωσε ο Τσόι Τζιν-γου, ο παραγωγός του «Masquerade».

Ακολουθήστε το insider.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις από την Ελλάδα και τον κόσμο.

Τεχνητή νοημοσύνη: Το «Instagram της μουσικής» και η εξάπλωση της K-pop σε 6 διαφορετικές γλώσσες

Πως λειτουργεί η διαδικασία

Η... NANSY της Superstone

Το «Instagram» της μουσικής

Διαβάζονται αυτή τη στιγμή

Πετρέλαιο θέρμανσης: Σε ποια τιμή θα αγοράσουν οι καταναλωτές, τι πρέπει να προσέξουν

Ηλεκτρονικές αποδείξεις: Ποιοι γλιτώνουν το «πέναλτι» 22%, ποιοι κερδίζουν έξτρα έκπτωση φόρου

Κάμερες στους δρόμους: Ποιες λειτουργούν πραγματικά