علم و تکنولوژی

اینترنت آرشیو، یک تریلیونمین وب‌سایت جهان را ثبت کرد

پروژه غیرانتفاعی «اینترنت آرشیو» پس از نزدیک به سه دهه فعالیت مداوم، موفق شد یک تریلیونمین صفحه وب را ذخیره کند. این رکورد تاریخی اهمیت حفاظت از حافظه دیجیتال بشر را بیش از پیش برجسته می‌کند.

همشهری آنلاین، فرخنده رفائی: اینترنت قرار بود جایی برای ذخیره ماندگار دانش باشد، اما واقعیت چیز دیگری است. محتواهای دیجیتال به‌سرعت ناپدید می‌شوند، لینک‌ها می‌میرند و بخش‌هایی از تاریخ آنلاین، بی‌صدا از بین می‌روند. در چنین شرایطی، رسیدن اینترنت آرشیو به رکورد ذخیره یک تریلیون صفحه وب، نقطه عطفی مهم در تاریخ حفاظت دیجیتال به شمار می‌آید.

به گزارش پاپ‌ساینس، اینترنت آرشیو که فعالیت خود را از سال ۱۹۹۶ آغاز کرده، امروز بزرگ‌ترین کتابخانه دیجیتال جهان محسوب می‌شود. هدف اصلی این پروژه، ایجاد «ثبت دائمی تحول اینترنت» بوده است؛ مأموریتی که با استفاده از خزنده‌های وب، مشارکت داوطلبان و آرشیو انواع محتوا از متون چاپی گرفته تا موسیقی و فایل‌های صوتی دنبال می‌شود.

ماهیت اینترنت همواره ناپایدار بوده است. بسیاری از محتواها تنها تا زمانی وجود دارند که کسی هزینه و مسئولیت نگهداری از آنها را بپذیرد. نمونه مشهور این ناپایداری، اتفاقی است که در سال ۲۰۱۹ برای MySpace رخ داد؛ جایی که در پی یک خطای فنی، بیش از ۵۰ میلیون قطعه موسیقی و آثار ۱۴ میلیون هنرمند برای همیشه از بین رفت. اینترنت آرشیو دقیقا برای جلوگیری از چنین فجایعی شکل گرفته است.

بیشتر بخوانید:

  • پایان تخریب دیجیتال | فناوری شیشه‌ای مایکروسافت داده‌ها را تا ۱۰ هزار سال حفظ می کند
  • پیش‌بینی مدیر سابق گوگل: هوش مصنوعی ارزش مدرک «پزشکی» و «حقوق» را به چالش می‌کشد
  • مدیر اینستاگرام در دادگاه: شبکه‌های اجتماعی «اعتیادآور» نیستند

تاکنون بیش از ۸۶۶ میلیارد صفحه وب، ۴۱ میلیون متن و میلیون‌ها فایل چندرسانه‌ای در این پایگاه ذخیره شده‌اند. هر روز حدود ۵۰۰ میلیون وب‌سایت جدید به این مجموعه افزوده می‌شود و حجم کل داده‌ها به حدود ۱۰۰ هزار ترابایت رسیده است؛ معادل حافظه ۵۰ هزار آیفون رده‌بالای امروزی.

با این حال، آینده این پروژه بدون چالش نیست. رقابت شدید شرکت‌های فناوری برای آموزش مدل‌های هوش مصنوعی، باعث شده بسیاری از رسانه‌های بزرگ از جمله گاردین، نیویورک‌تایمز و ی‌اس‌ای تودی، دسترسی اینترنت آرشیو به محتوای جدید خود را محدود کنند. این تصمیم‌ها، اگرچه با دغدغه‌های حقوقی و اقتصادی قابل درک است، اما خطر ایجاد شکاف در حافظه دیجیتال بشر را افزایش می‌دهد.

با وجود این موانع، اینترنت آرشیو همچنان یکی از حیاتی‌ترین زیرساخت‌های دانش در عصر دیجیتال باقی مانده است؛ پروژه‌ای که اگر حمایت و همکاری جهانی ادامه یابد، شاید روزی ثبت دو تریلیونمین صفحه وب را نیز جشن بگیرد.

گردآوری: کولاک
شما چه نظری دارید؟ دیدگاه خود را در سایت کولاک بنویسید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا