020.ir

صفر بیست - علم را با لذت بیاموزید

  • Increase font size
  • Default font size
  • Decrease font size
صفحه اصلی > تاریخ و جغرافی > سرزمین های دیگر > ما از واژه ساخته شده ایم

ما از واژه ساخته شده ایم

حميده احمديان راد

منشور کوروشگروهي از محققان با راهنمايي گرفتن از تكنيك هاي ژنوميكس، ابزاري ابداع كرده اند كه درباره چگونگي تغيير فرهنگ ها در طول زمان داده هاي كمي ارايه مي كند. ژنوميكس به مطالعه ژن ها و عملكردشان مي پردازد.

در تحقيقات مربوط به ژنوميكس مقادير عظيمي از داده ها تجزيه و تحليل مي شود تا درباره اين كه چگونه ژن ها عمل مي كنند و تغيير مي كنند مطالعه شود. ابزار جديد هم مقياسي عظيم را در نظر مي گيرد و فراواني استفاده از واژه ها در طول زمان را بررسي مي كند.

در اين رويكرد واژه ها يك واحد فرهنگي در نظر گرفته مي شوند. يكي از مديران پروژه مي گويد:«ژنوم حاوي اطلاعات ارثي است كه از نسلي به نسلي ديگر رسيده. كلماتي كه ما مورد استفاده قرار مي دهيم و داخل كتاب ها مي نويسيم هم از نسلي به نسلي ديگر مي رسند.»

ايدن و ژان باپتيست ميشل مديران «برنامه ديناميك تكاملي» دانشگاه هاروارد، واژه كالچروميكس را براي تحقيقشان به كار مي برند. اصطلاحي كه آنها مورد استفاده قرار مي دهند، تركيبي از واژه هاي كالچر به معني فرهنگ و ژنوميكس است. اولين ميوه كار آنها ايجاد پايگاه عظيم داده ها از واژه هاي 5.2 ميليون كتابي است كه بين سال هاي 1800 و 2000 منتشر شده است. اين ميزان كتاب تقريباً چهار درصد همه كتاب هاي منتشر شده جهان است. آنها در تحقيقشان از پروژه كتاب هاي گوگل استفاده كردند كه كتابخانه اش حاوي 15 ميليون كتاب است.

گوگل نرم افزاري دارد كه به همه اجازه دسترسی و تجزیه و تحلیل پایگاه داده هاي تكميل شده كه حاوي دو ميليارد واژه و عبارت است را مي دهد.

محققان مي گويند كه دانشمندان حوزه هاي علوم اجتماعي و رايانه و همچنين رياضيدانان مي توانند با پيدا كردن دفعات استفاده از هر واژه، ظهور و تكامل گرايش هاي فرهنگي را در طول زمان دريابند. ابزار آنها را مي توان براي ايجاد جدول زماني فرهنگي مورد استفاده قرار داد. اين ابزار استفاده اندك يا زياد از واژه هاي بخصوصي را هم نشان مي دهد.

براي مثال واژه توقيف، يك نشانه در تاريخ فرهنگ به جا مي گذارد. كتاب هاي آلماني زباني كه بين سال هاي 1936 و 1944 و در دوره سانسور حكومت نازي ها منتشر شدند به ندرت به هنرمندان و فلاسفه مشخصي كه بردن نام هايشان قبل و بعد از آن دوره متداول بوده است اشاره مي كنند.

همچنين تجزيه و تحليل ها كلماتي را نشان مي دهند كه در كتاب هاي انتشار يافته در اين دوره وجود داشته اند اما جايي در لغت نامه ها ندارند. از جمله اين كلمات مي توان به"aridification"  (به معني خشك كردن يك منطقه) و deletable (ريشه اين كلمه يعني واژه delete به معني حذف است) اشاره كرد. اين كلمات كه به هيچ منبع اطلاعاتي اي متصل نشده اند استثنائات ندارند. بعد از اين كه محققان همه واژه هاي موجود در لغت نامه هاي انگليسي را جمع بستند بيش از يك ميليون واژه – دو برابر تعداد واژه هاي موجود در لغت نامه هاي بزرگ امروزي كلمه شمردند. (براي مثال لغت نامه انگليسي آكسفورد كمتر از 500 هزار نوشته دارد.)

ايدن اميدوار است محققان بسياري از رشته ها راه هاي جديدي براي بهره برداري از اين داده ها پيدا كنند. وي مي گويد:«اين ابزار ديگري است كه در دسترس انسان شناسان قرار گرفته تا بينشي نو به دست آورند و به پرسش هايشان درباره طبيعت بشر پاسخ دهند.»

او و ميشل از سال 2007 كار جدي بر روي اين پروژه را آغاز كردند. همه كتاب هايي كه در كتابخانه ديجيتالي گوگل است در مالكيت عموم نيست، بنابراين محققان بايد دقت مي كردند تا از قانون كپي رايت تخطي نكنند. در اصل، آنها واژه ها را از متن كتاب ها برداشتند و داخل يك جدول فرکانسي عظیم سازمان دادند.

آنها داده هايشان را از صافي هايي گذراندند تا آنها را تا حد امكان دقيق كنند. براي مثال كتاب هايي كه تاريخ انتشارشان ناصحيح يا متنشان به شكلي ضعيف رونويسي شده بود را به وسيله نرم افزار وجين كردند. بعد از فيلتر كردن، آنها ماندند با 5,195,769 كتاب، حاوي متن هايي با بيشت از 500 ميليارد واژه كه حدود 72 درصدشان واژه هاي انگليسي بودند.

محاسبات فشرده اي لازم بود تا داده ها براساس دفعات تكرار هر واژه كه به وسيله ماشين آلات متعدد گوگل توزيع شده بود محدود شود و به سرعت كامل شود.

جان كلينبرگ، استاد علوم رايانه اي دانشگاه كورنل مي گويد كه تكرار واژه مي تواند ابزار كمي قدرتمندي براي تشخيص گرايش ها در فرهنگ باشد. او مي گويد:«نگاه كردن به رفتار تك تك واژه ها اغلب مي تواند اولين شاخص قوي از يك پديده در طول زمان باشد.» به هر صورت موارد اسكن شده فقط براي شروع هستند. متن هاي ديجيتالي ديگر هم منابع غني اي براي مطالعه كمي اطلاعات فرهنگي فراهم مي كنند. براي مثال، تجزيه و تحليل اصطلاحات جست و جوي گوگل آشكار مي كند كه مردم به چه چيزهايي علاقه مندند. يا مطالعه به روز شدن فيس بوك در مقياس وسيع مي تواند به عنوان يك پالس واقعي زماني توده ها را بررسي كند.

او مي گويد:«ما چيزهايي را مي بينيم كه هرگز قبلاً نوشته نشده اند. روي توييتر يا فيس بوك، ميليون ها نفر مي گويند كه «من خوشحالم» يا «احساس غم مي كنم». تا ده سال پيش كجا شما مي توانستيد ميليون ها نفر را پيدا كنيد كه احساسشان را بنويسند؟»

منبع: http://www.stardrive.org/index.php?option=com_content&view=article&id=2904:we-are-the-words&catid=43:science&Itemid=82

 

آگهی ها

بنر

آگهی کتاب

بنر

نظر سنجی