
مفهوم داده در زمینه محاسبات ریشه در کار کلود شانون، ریاضیدان آمریکایی معروف به پدر نظریه اطلاعات دارد. او مفاهیم دیجیتال باینری را بر اساس اعمال منطق بولی دو ارزشی در مدارهای الکترونیکی آغاز کرد. فرمتهای رقم دودویی زیربنای پردازندههای مرکزی، حافظههای نیمه هادی و درایوهای دیسک، و همچنین بسیاری از دستگاههای جانبی رایج در محاسبات امروزی هستند. ورودی های اولیه کامپیوتر برای کنترل و داده ها به شکل کارت های پانچ و به دنبال آن نوار مغناطیسی و هارد دیسک بود.
در اوایل، اهمیت داده ها در محاسبات تجاری با محبوبیت عبارات «پردازش داده» و «پردازش الکترونیکی داده» آشکار شد، که برای مدتی طیف کاملی را در بر گرفت که امروزه به عنوان فناوری اطلاعات شناخته می شود. در طول تاریخ محاسبات شرکتی، تخصصی شدن اتفاق افتاد و یک حرفه داده متمایز همراه با رشد پردازش داده های شرکتی پدیدار شد.

نحوه ذخیره داده ها
کامپیوترها داده ها، از جمله ویدئو، تصاویر، صداها و متن را به عنوان مقادیر باینری با استفاده از الگوهای تنها دو عدد نشان می دهند: 1 و 0. بیت کوچکترین واحد داده است و فقط یک مقدار را نشان می دهد. یک بایت هشت رقم باینری است. فضای ذخیره سازی و حافظه با مگابایت و گیگابایت اندازه گیری می شود.
واحدهای اندازه گیری داده با افزایش حجم داده های جمع آوری و ذخیره شده به رشد خود ادامه می دهند. برای مثال اصطلاح نسبتاً جدید “برونتوبایت” ذخیره سازی داده ای است که برابر با 10 تا 27 توان بایت است.
داده ها را می توان در قالب های فایل ذخیره کرد، مانند سیستم های اصلی که از ISAM و VSAM استفاده می کنند. فرمت های دیگر فایل برای ذخیره سازی، تبدیل و پردازش داده ها شامل مقادیر جدا شده با کاما است. این قالبها همچنان در انواع مختلف ماشینها کاربرد پیدا میکردند، حتی زمانی که رویکردهای دادهمحور ساختاریافتهتر در محاسبات شرکتی جای گرفتند.
تخصص بیشتر به عنوان پایگاه داده، سیستم مدیریت پایگاه داده و سپس فناوری پایگاه داده رابطه ای برای سازماندهی اطلاعات ایجاد شد.

انواه داده ها
رشد وب و گوشی های هوشمند در دهه گذشته منجر به افزایش تولید داده های دیجیتالی شده است. دادهها اکنون شامل اطلاعات متنی، صوتی و تصویری، و همچنین گزارشهای گزارش و فعالیتهای وب هستند. بیشتر آن داده های بدون ساختار است.
اصطلاح داده های بزرگ برای توصیف داده هایی در محدوده پتابایت یا بزرگتر استفاده شده است. خلاصهنویسی دادههای بزرگ را با 3 ولت به تصویر میکشد – حجم، تنوع و سرعت. با گسترش تجارت الکترونیک مبتنی بر وب، مدل های کسب و کار مبتنی بر داده های بزرگ تکامل یافته اند که داده ها را به خودی خود به عنوان یک دارایی در نظر می گیرند. چنین روندهایی همچنین باعث ایجاد دغدغه بیشتر با استفاده اجتماعی از داده ها و حریم خصوصی داده ها شده است.
داده ها معنایی فراتر از کاربرد آن در برنامه های کاربردی محاسباتی جهت پردازش داده ها دارند. به عنوان مثال، در اتصال قطعات الکترونیکی و ارتباطات شبکه، اصطلاح داده اغلب از “اطلاعات کنترل”، “بیت های کنترل” و اصطلاحات مشابه برای شناسایی محتوای اصلی یک واحد انتقال متمایز می شود. علاوه بر این، در علم، از اصطلاح داده برای توصیف مجموعه ای از حقایق استفاده می شود. این امر در زمینه هایی مانند امور مالی، بازاریابی، جمعیت شناسی و سلامت نیز صادق است.
مدیریت و استفاده از داده
با گسترش دادهها در سازمانها، تاکید بیشتری بر تضمین کیفیت دادهها با کاهش تکرار و تضمین دقیقترین سوابق جاری شده است. بسیاری از مراحل مربوط به مدیریت داده های مدرن شامل پاکسازی داده ها و همچنین فرآیندهای استخراج، تبدیل و بارگذاری (ETL) برای یکپارچه سازی داده ها است. دادههای پردازش با ابردادهها تکمیل میشوند، که گاهی اوقات به عنوان «دادههای مربوط به داده» نامیده میشود، که به مدیران و کاربران کمک میکند تا پایگاه داده و سایر دادهها را درک کنند.
تجزیه و تحلیل هایی که داده های ساختاریافته و بدون ساختار را ترکیب می کنند، مفید شده اند، زیرا سازمان ها به دنبال سرمایه گذاری بر روی چنین اطلاعاتی هستند. سیستمهایی برای چنین تحلیلهایی به طور فزایندهای برای عملکرد بلادرنگ تلاش میکنند، بنابراین برای مدیریت دادههای دریافتی مصرفشده با نرخهای بالا و پردازش جریانهای داده برای استفاده فوری در عملیات ساخته شدهاند.

با گذشت زمان، ایده پایگاه داده برای عملیات و تراکنش ها به پایگاه داده برای گزارش گیری و تجزیه و تحلیل داده های پیش بینی شده گسترش یافته است. یک مثال اصلی انبار داده است که برای پردازش سوالات مربوط به عملیات برای تحلیلگران تجاری و رهبران تجاری بهینه شده است. تاکید روزافزون بر یافتن الگوها و پیش بینی نتایج کسب و کار منجر به توسعه تکنیک های داده کاوی شده است.
متخصصان داده
حرفه مدیر پایگاه داده شاخه ای از فناوری اطلاعات است. این کارشناسان پایگاه داده روی طراحی، تنظیم و نگهداری پایگاه داده کار می کنند.
حرفه داده ریشه محکمی پیدا کرد زیرا سیستم مدیریت پایگاه داده رابطه ای (RDBMS) از دهه 1980 به طور گسترده در شرکت ها مورد استفاده قرار گرفت. ظهور پایگاه داده رابطه ای تا حدی توسط زبان پرس و جو ساختاریافته (SQL) فعال شد. بعدها، پایگاههای داده غیر SQL، که به پایگاههای داده NoSQL معروف هستند، به عنوان جایگزینی برای RDBMSهای ایجاد شده به وجود آمدند.
امروزه، شرکتها از متخصصان مدیریت داده استفاده میکنند یا نقش سرپرستی دادهها را به کارگران اختصاص میدهند، که شامل اجرای سیاستهای امنیتی و استفاده از داده است که در طرحهای حاکمیت داده مشخص شده است.
یک عنوان متمایز – دانشمند داده – به نظر می رسد برای توصیف متخصصان متمرکز بر داده کاوی و تجزیه و تحلیل. بهره مندی از ارائه علم داده به شیوه ای خاطره انگیز حتی باعث ظهور هنرمند داده شده است. یعنی فردی که در ترسیم نمودار و تجسم داده ها به روش های خلاقانه مهارت دارد.