סטודנטית בטכניון פיתחה מערכת חדשנית המפרשת סרקזם בטוויטר
זיהוי אוטומטי של רגשות בטקסט הוא אתגר מורכב ביותר, המעסיק חוקרים רבים ברחבי העולם בשל הפוטנציאל העסקי הטמון בו והעניין המדעי שהוא מעורר. זיהוי רגשות עשוי לשמש ביישומים חברתיים, מסחריים ואחרים ולשפר את התקשורת בין אדם למחשב ובין אנשים המשתמשים ברשתות חברתיות.
למרות ההתפתחות העצומה בתחום זה, וההצלחות בניתוח רגשות (sentiment analysis), היישומים הקיימים אינם יודעים להתמודד עם לשון סגי נהור (סרקזם), ההופכת על פיה את כוונת הכותב. לדוגמה, אם נפרש ציוץ סרקסטי כמו "הסרט החדש של מהיר ועצבני פשוט מצוין" פשוטו כמשמעו, נפספס לחלוטין את מהות האמירה.
לוטם פלד, סטודנטית לתואר שני בפקולטה להנדסת תעשייה וניהול בטכניון, פיתחה מערכת שמטרתה לפרש אמירות סרקסטיות. המערכת, שפותחה בהנחייתו של פרופ'-משנה רועי רייכרט,. לדברי פלד "אמנם קיימות הרבה מערכות שמטרתן זיהוי סרקזם, אבל זאת המערכת הראשונה בעולם המפרשת סרקזם בטקסט כתוב. אנחנו מקווים שבעתיד היא תסייע בין השאר לאנשים בעלי אוטיזם ותסמונת אספרגר המתקשים עם פירוש של סרקזם, אירוניה והומור."
המערכת החדשה, המבוססת על תרגום מכונה הופכת משפטים סרקסטיים למשפטים כנים (שאינם סרקסטיים). את המשפט האמור, "הסרט החדש של מהיר ועצבני פשוט מצוין" היא תהפוך למשפט כן: "הסרט החדש של מהיר ועצבני הוא איום ונורא."
כדי ללמד את המערכת לייצר את הפירושים האלה הרכיבו החוקרים בסיס נתונים ובו 3,000 ציוצים סרקסטיים, שתויגו ככאלה על ידי מחבריהם. לכל אחד מהציוצים "הוצמדו" חמישה פירושים לא סרקסטיים, שנכתבו על ידי בני אדם. המערכת אומנה על בסיס הנתונים הזה ובנוסף, אומנה לזהות מילים בעלות סנטימנט – למשל המילה Best בציוץ Best day ever – ולהחליף אותן במילים חריפות אשר חושפות את המשמעות הכנה של הכתוב, לדוגמה: Worst day ever. המערכת נבדקה על ידי שורה של שופטים אנושיים, ונמצא כי במרבית המקרים היא מייצרת משפט נכון הן מבחינה סמנטית והן מבחינה לשונית.