כתוביות AI – טכנולוגיה חדשנית במסע שיווקי, 2024
טכנולוגיה שיוצרת כתוביות, מתמללת ומתזמנת, תענוג!
לא צריך לשלם יותר את העלות של עורכי כתוביות אנושיים...
יש קטע כזה בשיווק מוצלח, הוא לא בהכרח ישכנע אותך שהמוצר טוב לך,
הוא ישכנע אותך אילו שאלות אתה אמור לשאול בשביל להחליט בעצמך
אם המוצר טוב לך.
ובהקשר של כתוביות AI לימדו אותנו לשאול: מה אחוז הטעויות בכתוביות מכונה
לעומת כתוביות בעריכה אנושית?
חכו רגע, לפני שמשווים בין תפוחי עץ לקיפודים, מה אנחנו מגדירים כטעות?
ובכלל, טעות אנושית אחת שוות ערך לטעות מכונה אחת?
זאת אומרת, ההשפעה שלהן זהה? ההשוואה הזאת לגיטימית?
מבחינת הטכנולוגיה "טעויות" בכתוביות AI הן פענוח שגוי של מילים, קליטה לא נכונה של השמע בהיעדר קשר לוגי בין המילים להקשר הספציפי שהמילים נאמרו בו.
"על כל סמים ומסיבות" במקום "אלכוהול, סמים ומסיבות",
"התקשר לי חלב" במקום "התגשם לי חלום".
לעומת זאת, טעויות אנושיות של מתמללים מקצועיים הן לרוב בהזנה של המידע,
כמו השמטת מילים ושיכולי אותיות. טעויות קליטה אנושיות הן נדירות וקורות בעיקר במצבים של עבודה בתנאי לחץ ותשישות.
ומה לגבי טעויות עברית שנאמרות במקור?
הרי אנחנו לא תמיד מקפידים לדבר נכון כמו שאנחנו מקפידים לכתוב נכון. אם מישהו אומר "אני יבוא אליך מחר" או "התלבטנו בין שלוש שמות", המכונה תתמלל כמו שנאמר, וכל עוד אין טעות פענוח, זה לא ייספר בסטטיסטיקה של טעויות התוכנה.
אבל מבחינת השורה התחתונה, זאת טעות בכתוביות. אנחנו תמיד נכתוב "אני אבוא", "שלושה שמות" או "3 שמות".
ואם המכונה לא דאגה לזה, אנחנו נדאג לזה בעריכת התוצר האוטומטי.
ומה לגבי משפטים קטועים וגמגומים מיותרים?
תוכנות תמלול מתייחסות לכל צליל שנשמע. ואם הדובר גמגם והגמגום הופיע בתמלול כגמגום, זה ייספר כתוצאה מדויקת, כי הקליטה נכונה.
אבל בכתוביות אסור להתייחס לכל גמגום. זה מסיח, לא אסתטי ועלול לפגוע בהבנה של הצופה וביכולת שלו לקרוא הכול לפני שהכתובית מתחלפת.
אז מקסימום יופיעו יותר מדי גמגומים ונמחק אותם בעריכה אנושית.
לא באמת… הטכנולוגיה לא תמיד מזהה כשיש גמגומים וקטיעות, היא מעבדת כל צליל בתור מילה או חלק ממילה ועלולה לכפות על הגמגום משמעות של מילה לא קשורה. ככה נוצרים שיבושים שמשפיעים גם על מילים אחרות שבסביבת הגמגום או הקטיעה.
ומה לגבי טעויות בעריכת חלוקת הכתוביות?
טכנולוגיית כתוביות AI מתייחסת בשיווק שלה רק לאיכות התמלול, ומתעלמת באלגנטיות מכל שאר היבטי המקצוע.
חלק חשוב מאוד שלא מקבל התייחסות בסטטיסטיקה של הטעויות הוא עריכה נכונה של הטקסט בשורות ובכתוביות בהתאמה לעלילה. הכתוביות חייבות להתחשב בגורמי ההפתעה והמתח שיש בתוכן. נגיד, אם הפאנץ' של הבדיחה יופיע מוקדם מדי, חוויית הצפייה פשוט תיהרס.
הטכנולוגיה מחלקת לכתוביות לפי מספר המילים או מספר התווים, ויוצרת כתובית חדשה ברגע שהכתובית הראשונה מתמלאת ומגיעה לגבול המילים/התווים שהוגדר לה.
לעומת זאת עורכי כתוביות מקצועיים מחלקים את הטקסט לכתוביות לפי דרישת התוכן. בין השאר, החלוקה היא כלי שעוזר לפרק את המשפט הסבוך לגורמים בשביל להבטיח קריאה חלקה כמה שיותר, ממש כמו סימני פיסוק. מספר התווים בשורה הוא רק עוד פרמטר אחד מבין רבים שנלקחים בחשבון בעריכת הכתוביות.
מה עם ענייני תזמון ואסתטיקה?
כתוביות שאינן מתוזמנות נכון, מושכות אליהן תשומת לב מיותרת ופוגעות ביכולת של הצופה להתרכז בתוכן עצמו.
הטכנולוגיה מתזמנת את הכתוביות לפי הצלילים, כשיש צליל, הכתובית מופיעה. כשרצף הצלילים מסתיים, היא נעלמת.
בעקביות, כתוביות AI מופיעות על המסך מוקדם מדי, ברגע שיש צליל של כיווץ שפתיים או נשימה עוד לפני תחילת הדיבור, ונעלמות מהר מדי כשעוד שומעים את ההד של ההברה האחרונה.
כתוביות איכות מתעלמות מצלילים שאינם דיבור, הן אמורות להופיע כשני פריימים (1/12 שנייה) אחרי שהדיבור מתחיל, ולהיעלם כחצי שנייה אחרי שהדיבור מפסיק. זה גם עניין אסתטי שמשפיע על חוויית הצפייה וגם עוזר למקד את הצופה בתוכן.
בסופו של דבר…
באמת אין לטכנולוגיה אותן טעויות הזנה כמו לבני אדם אבל יש לה טעויות מסוג אחר, טעויות שלא היו שם מלכתחילה בעבודה אנושית. וכשהתוצר עדיין תלוי בעריכה אנושית, תופעת טעויות ההזנה אינה מנוטרלת. להפך, היא מתגברת בעריכה אינטנסיבית של טקסט מבולגן וגם מתווספת אליה בעיה חדשה של טעויות קליטה.
ההשוואה השיווקית בין אחוז הטעויות של הטכנולוגיה לאחוז הטעויות האנושיות לא רלוונטית בכלל כשההגדרה של טעות בטכנולוגיה חסרה ומתעלמת מכל הדברים שדורשים תיקון.
בשביל לקבל מספר שבאמת אפשר להשוות אותו מול אחוז הטעויות האנושיות, תיקחו את סכום אחוזי טעויות המכונה, תוסיפו עליו קצת (או הרבה בעצם) כדי לכלול גם טעויות שלא מחושבות בסטטיסטיקה כמו טעויות של גמגומים מיותרים, טעויות עברית מהמקור, חלוקת כתוביות ותזמון, ותחברו לזה גם את סכום אחוז הטעויות האנושיות שעדיין קיים, ואז הסכום שתקבלו יהיה רלוונטי להשוואה.
אחרי שהבנו ששיווקו לנו את השאלה הלא נכונה, אנחנו צריכים להיזכר מה בכלל גרם לנו לבדוק את הפתרון של כתוביות מכונה. אם זה היה עניין של מחיר, אז ראוי לשאול: מה דורשת העריכה של תוצר המכונה? היא חוסכת את הצורך באיש מקצוע? ואם לא, היא לפחות חוסכת זמן לאיש המקצוע כי הוא עורך במקום ליצור מאפס?
ואם זה באמת היה עניין של טעויות חוזרות בכתוביות, אז ראוי לשקול החלפת ספק (כאן תוכלו למצוא טיפים לבחירת ספק כתוביות).
וראוי להפנות את השאלות האלה לאנשי המקצוע שבאמת מבינים במה כרוכה המלאכה של יצירת כתוביות איכות, ולא למפתחי תוכנה.
אני יכולה להגיד מניסיוני האישי, טעויות הקליטה של המכונה לפעמים משכנעות כל כך שקשה לזהות אותן, וכשהן באות בתוך בלגן שלם של תזמון לקוי וחלוקת כתוביות לא הגיונית, זה עוד יותר מבלבל. העריכה הנדרשת לכתוביות אוטומטיות היא אינטנסיבית כל כך ואי אפשר להבטיח שבכלל ישימו לב לכל הבעיות. כך שאחרי שמסיימים לערוך את הטקסט של המכונה, יש עדיין צורך בהגהה קפדנית.
בשורה התחתונה, הטכנולוגיה של כתוביות AI אינה חוסכת את עלות אנשי המקצוע וגם אינה מצמצמת את משך זמן העבודה. ויותר מזה, היא מגבירה את הסיכוי לטעויות בתוצר הסופי. ככל שיש יותר טעויות, ככה גדל הסיכוי לפספס משהו.