[Discovery] Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Bộ lông đặc biệt của chuột trũi

Chuột chũi

Mỗi sợi lông trên cơ thể chuột trũi đều được đặt vào trong một túi chất dịch, cho phép chúng có thể hướng theo bất kì hướng nào. Đó là một cách thích nghi tuyệt vời khi chuột trũi sống trong hang tự đào rộng vừa đủ kích thước cơ thể của chúng và chúng có một cách di chuyển trong hang là bò vào và bò ngược trở ra. Bộ lông với khả năng khí động học thay đổi theo bất kì hướng di chuyển nào khiến cuộc sống của chúng trở nên dễ dàng hơn nhiều.

Côn trùng có máu không?

Một số động vật cao cấp như lợn, bò, ngựa, gà, vịt, thậm chí như con người đều có máu đỏ tươi. Còn động vật cấp thấp như tôm, dế, châu chấu, chuồn chuồn… trong cơ thể của chúng cũng có máu không ngừng tuần hoàn, nhưng lại trong suốt hoặc có màu khác.

Đó là vì trong máu của những côn trùng này chỉ có tế bào giống như huyết cầu của động vật cao cấp, mà thiếu mất hồng huyết cầu. Do không có hồng huyết cầu cho nên không có huyết sắc tố. Vì thế, máu của những loài động vật này không phải là màu hồng. Có côn trùng mang dòng máu xanh hoặc màu vàng, là do trong huyết tương của nó có chứa sắc tố vàng hoặc xanh.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Gọi là máu nhưng thực ra chúng có tên là hemolymph, xuất hiện từ cách đây 500 đến 600 triệu năm khi mà con người là côn trùng còn chung một tổ tiên. Hemolymph có chứa chất đồng chứ không phải sắt như trong máu người nên có màu xanh dương hoặc xanh lục khi bị oxy hóa.

Hemolymph không có chức năng vận chuyển oxy bởi vì quá trình hô hấp thông qua da của côn trùng giúp chúng hấp thụ đủ lượng oxy cần thiết. Điều này đồng nghĩa rằng chúng có hệ thống tuần hoàn đơn giản hơn nhiều. Tim của côn trùng đập chậm hơn nhiều so với con người và thậm chí chúng có thể rơi vào trạng thái “ngủ” để duy trì năng lượng.

Axolotl (khủng long 6 sừng) không thể trưởng thành

Khủng long 6 sừng là loài lưỡng cư quyến rũ, có dáng vẻ và điệu bộ giống như những con quái vật nhỏ bé thời tiền sử. Đầu của nó to lớn, mắt không có mí, chân chưa phát triển hoàn toàn và có móng dài mỏng. Con đực có đặc điểm là bộ phận sinh dục phồng lên với những nhú, còn con cái dễ được nhận biết nhờ thân mình to lớn hơn con đực, có đầy đủ chân. Phía sau đầu của nó mọc 3 cặp cuống mang, giống như những cái sừng (nên nó còn có tên là khủng long 6 sừng), có chức năng hút khí ôxy từ nước. Khủng long 6 sừng thở bằng mang. tại nhiều nước trên thế giới, con vật này thường được nuôi làm cảnh trong nhà, hoặc được dùng cho các mục đích nghiên cứu trong các phòng thí nghiệm. Có một điều ít người được biết là những thổ đân ở mexico từ thời đại tiền Aztec thường bắt nó nướng lên làm thức ăn.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Khủng long 6 sừng là dạng ấu trùng của loài kỳ giông, nhưng lại khác với những động vật lưỡng cư khác ở chỗ, nó có khả năng sinh sản ở trạng thái ấu trùng. Điều kỳ lạ ở loài này là chúng giữ lại những đặc điểm từ giai đoạn ấu trùng trong suốt thời kỳ trưởng thành.

Loài cú không thông minh

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Loài chim cú có bộ mặt trông khá ngờ nghệch. Và sự thật thì chúng cũng không hề thông minh chút nào. Với đôi mắt khá to nhưng bộ óc chúng thì không hề to như vậy. Với khung sọ nhỏ có rất ít không gian cho não bộ, trong khi chúng phải xử lý một lượng rất lớn dữ liệu hình ảnh, nên loài cú có suy nghĩ không hề nhạy bén. Nếu cần huấn luyện loài cú để làm những nhiệm vụ đơn giản nhất thì đây là điều không tưởng. Gary Gero, một nhà huấn luyện cú đã tham gia hợp tác sản xuất bộ phim Harry Potter đã nói rằng nếu người nào cho rằng cú rất thông minh thì chắc chắn họ chưa hề nuôi chúng bao giờ.

Tảo “hủy diệt” Taxifolia

Tảo Caulerpa taxifolia còn được mệnh danh là “kẻ hủy diệt” dưới đại dương. axifolia là một loài rong biển sinh trưởng mạnh mẽ, sản xuất ra một chất độc mà làm các sinh vật biển khác không thể ăn được chúng. Vì vậy, khi được thả vào trong môi trường phù hợp chúng có thể sinh sản rất nhanh và phá vỡ cân bằng hệ sinh thái. Nó được gọi là “Tảo giết chóc”, và bị Hiệp hội Bảo tồn Thế giới đưa vào “Danh sách 100 loài ngoại lai xâm hại tồi tệ nhất thế giới”.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Vào năm 1984, các nhà hải dương học đã phát hiện ra loài tảo nguy hiểm này dưới đáy biển ở Công quốc Monaco. Trong gần ba thập niên qua, tảo Caulerpa taxifolia đã hủy diệt 15.000 hecta thực vật dưới đại dương dọc theo các bờ biển thuộc vùng đông nam nước Pháp. Không chỉ tại Pháp, mà nhiều vùng biển của các nước ở khu vực Địa Trung Hải gồm Italia, Tây Ban Nha, Croatia và Tunisia đều bị loài thực vật ký sinh này tấn công.

Trong một cuộc khảo sát mới đây dưới đáy đại dương ở một vùng biển đông nam nước Pháp, các nhà hải dương học đã ngạc nhiên khi phát hiện khoảng 80% số tảo Caulerpa taxifolia tại đây đã biến mất. Hiện nguyên nhân của hiện tượng lạ này vẫn chưa được xác định. Một số giả thuyết đã được đưa ra, trong đó có việc cho rằng loài tảo xích đạo này tự hủy diệt do nhiệt độ ở vùng biển này ngày càng giảm.

Loài chim có tay

Hoatzin ( Danh Pháp Khoa Học: Opisthocomus hoazin), còn được gọi là Hoactzin, Stinkbird, hoặc Pheasant Canje, là một loài chim nhiệt đới được tìm thấy trong các đầm lầy, rừng ven sông và rừng ngập mặn của Amazon và đồng bằng sông Orinoco ở Nam Mỹ. Điều đáng chú ý giống loài gà có móng vuốt, giống như các loại động vật có vú khác.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Chim hoatzin thực sự là một loài chim trông khá “trải chuốt” nhưng khị bị con người tấn công chúng có thể thải ra mùi hôi thối kinh khủng. Có một số ít loài chim khi ấp trứng có móng vuốt trên cánh, nhưng hoatzin có móng vuốt trên cánh và chân lại vì một mục đích khác.

Chim non rất hiếu động và sử dụng cặp vuốt trên mỗi cánh để bám khi di chuyển trên cây. Nếu chúng rơi xuống nước, chúng cũng có thể bơi tốt. Trên thực tế chỉ có thứ chúng không giỏi đó là khả năng bay. Chim non phải đợi vài tháng để phát triển hoàn chỉnh mới có thể bay được và khi trưởng thành thì chúng cũng vô cùng lóng ngóng vụng về mỗi khi cất cánh.

Loài Siphonophores bí ẩn

Siphonophores là một loại động vật mang vẻ đẹp lạ lùng, trông chúng giống như những bông hoa của đại dương. Loài vật này sống nhiều nhất ở vùng biển thuộc Bồ Đào Nha, tuy nhiên nó lại là một trong những sinh vật nổi tiếng nhất đại dương bởi sự điệu đà trong màu sắc của mình. Một trong số những loài thuộc Siphonophores là những động vật dài nhất thế giới, có chiều dài lên đến 40 mét. Đa số loài Siphonophores dài và mỏng, nhìn trong suốt. Một loài biến thể khác của Siphonophores khi sống ở những vùng nước sâu và tối thường có màu da cam hoặc đỏ.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Một con Siphonophore không phải là một sinh vật đơn độc, mà là một quần thể tập hợp chung nhiều cá thể nhỏ gọi là zooids, mỗi zooid có những nhiệm vụ riêng (như tự vệ, sinh sản, ăn..) để góp phần vào cả quần thể. Chúng phải dựa vào nhau để thực hiện tất cả chức năng sinh tồn. Dẫu tất cả chúng có thể tách rời khỏi quần thể, nhưng toàn bộ con siphonophore vẫn phát triển từ một trứng độc lập.

Khám phá những điều thú vị về các loài động vật có thể bạn chưa biết

Vậy chúng là một sinh vật hay là nhiều sinh vật. Câu trả lời rõ ràng cho vấn đề này vẫn làm khó các nhà khoa học. Nếu nhìn từ xa trông chúng có vẻ giống như một sinh vật độc lập, nhưng nếu nhìn gần vào bạn có thể chúng được tạo thành từ nhiều phần khác biệt. Bởi vì chúng nằm ở ngay trên ranh giới giữa cơ thể độc lập và một sinh vật đa bào phức tạp, siphonophore có thể nắm giữ nhiều đầu mối khoa học vô cùng quan trọng về tiến hóa.

[Discovery] Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Và có thể phải rất lâu nữa con người mới đặt được bàn chân đầu tiên lên một hành tinh gần nhất vì những trở ngại về kỹ thuật dưới đây.

1. Phá vỡ giới hạn ánh sáng

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Nhiều câu chuyện khẳng định một cách vô căn cứ về khả năng vượt qua tốc độ ánh sáng. Nhưng giới hạn vật lý không cho phép điều đó xảy ra. Thậm chí còn chưa thể đạt được tốc độ gần bằng ánh sáng nữa.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Giải pháp duy nhất mà chúng ta nghĩ đến là du hành qua Lỗ Giun. Nhưng một công cụ như vậy cần có một nguồn năng lượng rất lớn đến tạo ra, và cần được kiểm soát chặt chẽ. Tất cả đều thách thức đối với kỹ thuật hiện đại ngày nay. Tệ hơn nữa, nếu chúng ta đã có một Lỗ Giun thì một hiệu ứng vật lý thứ hai lại cản trở những chuyến du hành đầu tiên vì bất cứ vật thể nào lọt vào miệng Lỗ Giun đều bị phân tách thành từng nguyên tử nhỏ. Khi tới đầu bên kia của nó, bạn chỉ tồn tại dưới dạng Plasma.

Lỗ Giun được kiểm soát an toàn

Lỗ Giun được kiểm soát an toàn

2. Dịch chuyển tức thời

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Một phương pháp khác được cho là dễ dàng và giá thành rẻ hơn là Dịch chuyển tức thời có nghĩa là một người biến mất ở vị trí ban đầu và hiện ra ở một nơi rất xa trong tích tắc. Trên thực tế không phải như phim ảnh. Nếu có một chiếc máy có khả năng tháo rời từng cơ quan con người thành các nguyên tử để gửi chúng tới đích thì việc lắp ráp đúng như cũ lại là một khó khăn không nhỏ.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Ngôi sao gần Mặt Trời nhất cũng đến 4 năm ánh sáng vì vậy các nguyên tử cũng phải mất ít nhất 4 năm dạo chơi ngoài không gian đầy mối đe dọa và rủi ro là cực kỳ cao. Ai mà biết cái máy thứ hai ở ngôi sao kia có phá hủy phiên bản gốc để tái tạo ra một con người hoàn toàn mới hay không. Nhiều người sẽ không thích việc một bản sao khác thế chỗ mình như vậy.

Nguyên tử phải trải qua một thời gian dài chịu rủi ro ngoài không gian

Nguyên tử phải trải qua một thời gian dài chịu rủi ro ngoài không gian

3. Con tàu thế hệ

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Nếu đi nhanh hơn tốc độ ánh sáng là việc không tưởng thì chúng ta sẽ đi với tốc độ “rùa” bằng một con tàu Thế hệ. Mặc dù, chỉ mất 4 năm ánh sáng có thể tới được ngôi sao gần nhất thì chúng ta sẽ tốn gấp nhiều lần thời gian đó – có thể hàng trăm năm. Với tốc độ ngày nay phải mất 30 năm một con tàu vũ trụ mới tới được rìa của hệ mặt trời, 6 tháng để tới sao Hỏa.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Một con tàu lớn sẽ là nơi lý tưởng cho nhiều thế hệ con cháu chúng ta sinh ra và lớn lên cùng nhau chờ đợi ngày cập bến. Tuy nhiên, chúng có thể quên mất sứ mệnh ban đầu của tổ tiên như một huyền thoại sau từng ấy thời gian. Để khắc phục, sẽ có một hệ thống máy tính thông minh thường xuyên nhắc nhở và giáo dục cháu chắt chúng ta hàng trăm năm nhưng rất khó dự đoán được điều gì sẽ xảy ra.

4. Con tàu Trứng

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Để loại bỏ rủi ro mắc phải khi nhiều thế hệ quên mất nhiệm vụ thì người ta nghĩ ra một con tàu mang tên Tàu Trứng thay thế. Tại đây, quá trình thụ tinh đông lạnh sẽ được máy móc thực hiện đúng thời điểm từ những quả trứng gửi lên từ Trái Đất từ hàng trăm năm. Chúng sẽ phát triển thành con người đúng lúc  con tàu cập bến hành tinh xa xôi kia và máy tính sẽ dạy dỗ và giáo dục chúng biết về cách thức sinh tồn và về sứ mệnh cao cả của loài người.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Tuy nhiên, như thế không không giải quyết được khao khát du lịch xuyên không gian của một cá nhân vì con người kia sinh ra cũng là lúc chúng ta chỉ còn là cát bụi.

5. Tuổi thọ

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Đã vậy, các nhà khoa học tiếp tục nghĩ tới giải pháp kéo dài tuổi thọ con người lên hàng trăm năm để không bị những hậu quả như trên tàu Thế hệ và tàu Trứng. Sự bất tử vẫn được nghiên cứu nghiêm túc nhưng trở ngại lớn nhất là telomere – phần chóp của các ADN, chúng bị bào mòn mỗi lần phân chia tế bào. Đến khi đoạn telomere này mất đi thì các tế bào cơ thể sẽ bị lão hóa và chết. ADN giới hạn số lần phân chia tế bào chúng ta. Nhưng đó là quá trình cần thiết để cơ thể tự sửa chữa, phục hồi sau những tổn thương. Chỉ có một loại tế bào có khả năng kéo dài vô tận đoạn ADN giới hạn tuổi thọ này là những tế bào ung thư.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

6. Bảo quản

Trong nhiều bộ phim, con người vẫn sử dụng phương pháp bảo quản cơ thể trong dung dịch lỏng suốt chặng đường dài. Mọi người sẽ ngừng phát triển trong trạng thái đó hoặc sẽ rất chậm giống như ngủ đông ở động vật.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Thật không may, tác dụng của telomere lại cần thiết trong trường hợp này. Cơ thể chúng ta luôn luôn chứa một lượng nhỏ chất phóng xạ ở mức vô hại vì các tế bào liên tục được thay thế khi bị tổn thương. Nếu có một người trong tình trạng bảo quản sâu như trên thì các telomere của anh ta không thể rút ngắn lại được và tế bào không được phân chia. Bất kỳ một nguyên tố phóng xạ nào được giải phóng cũng có thể đủ thời gian để gây tổn thương vĩnh viễn cho cơ thể và dẫn tới tử vong.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Thậm chí quá trình lão hóa cũng không theo kịp thiệt hạido phóng xạ gây ra. Chúng ta lại muốn tế bao được phân chia và lớn lên một cách bình thường.

7. Động cơ đẩy

Nếu các vấn đề trên được giải quyết thì con người lại đối mặt với động cơ đẩy tàu hoàn hảo. Một hệ thống đẩy tên lửa truyền thống để đốt cháy nguyên liệu không thể sử dụng để du hành một quãng đường xa xôi. Do đó, chúng ta phải tiếp nhiên liệu trên đường đi. Giữa các khoảng không gian đều dồi dào hidro nhưng không có trạm đỗ an toàn để nạp chúng.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Với tốc độ nhanh như thế, chúng ta chỉ có thể vơ vét từng nguyên tử hidro một cho vào lò phản ứng hạt nhân (nếu kỹ thuật đã cho phép tạo được một lò phản ứng an toàn). Và để làm được điều đó, chúng ta cần một cái “muỗng” lớn và tính sơ cũng ít nhất có diện tích 2000 km vuông. Cái muỗng đó sẽ làm tê liệt con tàu và làm chậm bước tiến của chúng ta. Do đó, việc này không khả thi và không hiệu quả nếu tàu đi vào vùng không gian nghèo hidro.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

8. Nguy cơ

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Ngôi sao Alpha Centauri chỉ cách Mặt Trời 4 năm ánh sáng nhưng nếu đi với tốc độ 60km/h thì phải mất 72 triệu năm để nhìn thấy hành tinh đầu tiên ở đó. Vượt qua từng ấy thời gian, không máy móc nào là không hư hỏng, rỉ sét và trở thành đóng sắt vụn khi chưa kịp tới nơi.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Tốc độ là cần thiết ngay cả khi bị giới hạn bởi vận tốc ánh sáng. Các nguyên tử nhỏ rải rác khắp không gian, bất kỳ một con tàu nào di chuyển nhanh đều bị va chạm và bào mòn, ngay cả với chất liệu tốt nhất. Một lỗ kim nhỏ cũng nguy hiểm với con tàu không gian hiện đại và phải huy động một lực lượng hùng hậu để thường xuyên sửa chữa chúng. Hoặc đơn giản con tàu phải làm từ nguyên liệu “sống” có khả năng tự chữa lành như thằn lằn. Tin tốt là NASA đã tiến hành nghiên cứu một nguyên vật liệu như vậy còn tin xấu là họ nghĩ dự án đó là không khả thi.

9. Con người

Cấu trúc cơ thể chúng ta phụ thuộc vào trọng lực. Khi con người sống lâu trong môi trường khác lực hút Trái Đất thì cơ thể bắt đầu bị ảnh hưởng. Sau 1 vài tuần hoặc vài tháng, xương của chúng ta trở nên giòn và cơ bắp thì mệt mỏi với nhiều triệu chứng khó chịu khác.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Thời gian luyện tập thể dục chiếm phần lớn thời gian trong ngày cùng chế độ ăn đặc biệt nhưng sau nhiều thập kỷ cơ thể con người chắc chắn bị tổn hại vĩnh viễn. Ngay cả đối vói các chuyến bay tương đối ngắn thì thị lực vẫn bị suy yếu đến nỗi NASA coi đó là trướng ngại cần vượt qua trước khi thực hiện nhiệm vụ đưa người lên sao Hỏa.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Thay vì sống trong trạng thái vô trọng lượng, ta có thể tăng lực hấp dẫn bằng cách quay tàu vũ trụ quanh một trục. Thật không may, điều này đòi hỏi một lượng năng lượng và nhiên liệu lớn và sẽ gây tình trạng buồn nôn trong thời gian ngắn cho các du hành gia. Còn những ảnh hưởng lâu dài vãn chưa được nghiên cứu thêm.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

10. Thực phẩm, không khí và nước

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Bất kỳ một điều kiện nào giải quyết được thì con người trên tàu vũ trụ vẫn cần ăn, uống, hút thở, đi tiểu, bài tiết và giấc ngủ. Trong thời gian quá lớn, đây là vấn đề nghiêm trọng nhất gây khó khăn cho chúng ta.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Giải pháp có thể làm được là biến con tàu thành một hệ sinh thái khép kín. Các nhà máy sẽ sản xuất không khí, thức ăn, và tiêu thụ chất thải. Dù các hệ sinh thái hơi kém hiệu quả nhưng nó có thể duy trì sự sống đủ dài khi đến đích. Trang thiết bị của tàu sẽ dần bị phân hủy bởi các loại khí tái chế nhưng sự bảo trì thông minh hoặc các vật liệu mới sẽ tự sửa chữa.

Những công nghệ tương lai cần thiết giúp con người làm chủ vũ trũ

Tảo là đối tượng nghiên cứu tiềm năng trong việc cung cấp không khí, thực phẩm và giải quyết chất thải. Nó không phải nguồn dinh dưỡng hoàn chỉnh và độc hại nếu ăn với số lượng lớn nhưng kỹ thuật di truyền có thể thay đổi điều đó trong tương lai.

[Technology] Big Data là gì và người ta khai thác, ứng dụng nó vào cuộc sống như thế nào?

big-data-image.

Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp đến nỗi những công cụ, ứng dụng xử lí dữ liệu truyền thống không thể nào đảm đương được. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực. Chính vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường. Trong bài này, mời các bạn cùng tìm hiểu về Big Data, các phương thức người ta dùng để khai thác nó và nó giúp ích như thế nào cho cuộc sống của chúng ta.

1. Định nghĩa Big Data

Như đã nói ở trên, Big Data (“dữ liệu lớn”) có là tập hợp dữ liệu có dung lượng vượt mức đảm đương của những ứng dụng và công cụ truyền thống. Kích cỡ của Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu mà thôi.

Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng loại (variety). Giờ đây, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data. Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn phải “cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc”.

Chúng ta có thể lấy các thí nghiệm của Máy gia tốc hạt lớn (LHC) ở Châu Âu làm ví dụ cho Big Data. Khi các thí nghiệm này được tiến hành, kết quả sẽ được ghi nhận bởi 150 triệu cảm biến với nhiệm vụ truyền tải dữ liệu khoảng 40 triệu lần mỗi giây. Kết quả là nếu như LHC ghi nhận hết kết quả từ mọi cảm biến thì luồng dữ liệu sẽ trở nên vô cùng lớn, có thể đạt đến 150 triệu petabyte mỗi năm, hoặc 500 exabyte mỗi ngày, cao hơn 200 lần so với tất cả các nguồn dữ liệu khác trên thế giới gộp loại.

CMS_Higgs-event.
Đây là kết quả mô phỏng của một vụ va chạm giữa các hạt sơ cấp trong máy gia tốc LHC, có rất rất nhiều thông tin cần phải ghi nhận trong mỗi vụ chạm như thế này

Trong mỗi giây như thế lại có đến khoảng 600 triệu vụ va chạm giữa các hạt vật chất diễn ra, nhưng sau khi chọn lọc lại từ khoảng 99,999% các luồng dữ liệu đó, chỉ có tầm 100 vụ va chạm là được các nhà khoa học quan tâm. Điều này có nghĩa là cơ quan chủ quản LHC phải tìm những biện pháp mới để quản lý và xử lí hết mớ dữ liệu khổng lồ này.

Một ví dụ khác, khi Sloan Digital Sky Sruver, một trạm quan sát vũ trụ đặt tại New Mexico, bắt đầu đi vào hoạt động hồi năm 2000, sau một vài tuần nó đã thu thập dữ liệu lớn hơn tổng lượng dữ liệu mà ngành thiên văn học đã từng thu thập trong quá khứ, khoảng 200GB mỗi đêm và hiện tổng dung lượng đã đạt đến hơn 140 terabyte. Đài quan sát LSST để thay thế cho SDSS dự kiến khánh thành trong năm 2016 thì sẽ thu thập lượng dữ liệu tương đương như trên nhưng chỉ trong vòng 5 ngày.

Hoặc như công tác giải mã di truyền của con người chẳng hạn. Trước đây công việc này mất đến 10 năm để xử lí, còn bây giờ người ta chỉ cần một tuần là đã hoàn thành. Còn Trung tâm giả lập khí hậu của NASA thì đang chứa 32 petabyte dữ liệu về quan trắc thời tiết và giả lập trong siêu máy tính của họ. Việc lưu trữ hình ảnh, văn bản và các nội dung đa phương tiện khác trên Wikipedia cũng như ghi nhận hành vi chỉnh sửa của người dùng cũng cấu thành một tập hợp Big Data lớn.

Viegas-UserActivityonWikipedia.
Hoạt động của người dùng Wikipedia được mô hình hóa và với kích thước hàng terabyte, đây cũng có thể được xem là một dạng Big Data

2. Vài thông tin về tình hình Big Data hiện nay

Theo tài liệu của Intel vào tháng 9/2013, hiện nay thế giới đang tạo ra 1 petabyte dữ liệu trong mỗi 11 giây và nó tương đương với một đoạn video HD dài 13 năm. Bản thân các công ty, doanh nghiệp cũng đang sở hữu Big Data của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình.

Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB.

Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan.

Còn theo tập đoàn SAS, chúng ta có một vài số liệu thú vị về Big Data như sau:

  • Các hệ thống RFID (một dạng kết nối tầm gần, như kiểu NFC nhưng có tầm hoạt động xa hơn và cũng là thứ dùng trong thẻ mở cửa khách sạn) tạo ra lượng dữ liệu lớn hơn 1.000 lần so với mã vạc truyền thống
  • Chỉ trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản 5.000 giao diện mỗi giây.
  • Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầu từ khách hàng của mình mỗi ngày
  • Dịch vụ thẻ VISA xử lí hơn 172.800.000 giao dịch thẻ chỉ trong vòng một ngày mà thôi
  • Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15 tỉ thành viên tạo ra một mớ khổng lồ dữ liệu văn bản, tập tin, video…

3. Công nghệ dùng trong Big Data

Big Data là nhu cầu đang tăng trưởng lớn đến nỗi Software AG, Oracle, IBM, Microsoft, SAP, EMC, HP và Dell đã chi hơn 15 tỉ USD cho các công ty chuyên về quản lí và phân tích dữ liệu. Năm 2010, ngành công nghiệp Big Data có giá trị hơn 100 tỉ USD và đang tăng nhanh với tốc độ 10% mỗi năm, nhanh gấp đôi so với tổng ngành phần mềm nói chung.

Big-Data-Trends.0031.
Một số công ty có tham gia vào lĩnh vực Big Data

Như đã nói ở trên, Big Data cần đến các kĩ thuật khai thác thông tin rất đặc biệt do tính chất khổng lồ và phức tạp của nó. Năm 2011, tập đoàn phân tích McKinsey đề xuất những công nghệ có thể dùng với Big Data bao gồm crowsourcing (tận dụng nguồn lực từ nhiều thiết bị điện toán trên toàn cầu để cùng nhau xử lí dữ liệu), các thuật toán về gen và di truyền, những biện pháp machine learning (ý chỉ các hệ thống có khả năng học hỏi từ dữ liệu, một nhánh của trí tuệ nhân tạo), xử lí ngôn ngữ tự nhiên (giống như Siri hay Google Voice Search, nhưng cao cấp hơn), xử lí tín hiệu, mô phỏng, phân tích chuỗi thời gian, mô hình hóa, kết hợp các server mạnh lại với nhau…. Những kĩ thuật này rất phức tạp nên chúng ta không đi sâu nói về chúng.

lossy-page1-608px-DARPA’s_Topological_Data_Analysis_program.tiff.
Một trong những mô hình về cấu trúc cơ bản của một tập hợp dữ liệu rất lớn do bộ phận nghiên cứu của Bộ quốc phòng Mỹ đưa ra

Ngoài ra, các cơ sở dữ liệu hỗ trợ xử lí dữ liệu song song, ứng dụng hoạt động dựa trên hoạt động tìm kiếm, file system dạng rời rạc, các hệ thống điện toán đám mây (bao gồm ứng dụng, nguồn lực tính toán cũng như không gian lưu trữ) và bản thân Internet cũng là những công cụ đắc lực phục vụ cho công tác nghiên cứu và trích xuất thông tin từ “dữ liệu lớn”. Hiện nay cũng có vài cơ sở dữ liệu theo dạng quan hệ (bảng) có khả năng chứa hàng petabyte dữ liệu, chúng cũng có thể tải, quản lí, sao lưu và tối ưu hóa cách sử dụng Big Data nữa.

Những người làm việc với Big Data thường cảm tháy khó chịu với các hệ thống lưu trữ dữ liệu vì tốc độ chậm, do đó họ thích những loại ổ lưu trữ nào có thể gắn trực tiếp vào máy tính (cũng như ổ cứng gắn trong máy tính của chúng ta vậy). Ổ đó có thể là SSD cho đến các đĩa SATA nằm trong một lưới lưu trữ cỡ lớn. Những người này nhìn vào ổ NAS hay hệ thống lưu trữ mạng SAN với góc nhìn rằng những thứ này quá phức tạp, đắt và chậm. Những tính chất nói trên không phù hợp cho hệ thống dùng để phân tích Big Data vốn nhắm đến hiệu năng cao, tận dụng hạ tầng thông dụng và chi phí thấp. Ngoài ra, việc phân tích Big Data cũng cần phải được áp dụng theo thời gian thực hoặc cận thời gian thực, thế nên độ trễ cần phải được loại bỏ bất kì khi nào và bất kì nơi nào có thể.

4. Big Data có thể giúp gì được cho chúng ta?

Tập đoàn SAS nói vấn đề thật sự không nằm ở việc bạn thu thập dữ liệu, thay vào đó, là bạn dùng Big Data để làm gì. Nhìn chung, có bốn lợi ích mà Big Data có thể mang lại: cắt giảm chi phí, giảm thời gian, tăng thời gian phát triển và tối ưu hóa sản phẩm, đồng thời hỗ trợ con người đưa ra những quyết định đúng và hợp lý hơn.

Nếu để ý một chút, bạn sẽ thấy khi mua sắm online trên eBay, Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản phẩm gợi ý tiếp theo cho bạn, ví dụ khi xem điện thoại, nó sẽ gợi ý cho bạn mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun thì sẽ có thêm gợi ý quần jean, dây nịt… Do đó, nghiên cứu được sở thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn.

Vậy những thông tin về thói quen, sở thích này có được từ đâu? Chính là từ lượng dữ liệu khổng lồ mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web của mình. Chỉ cần doanh nghiệp biết khai thác một cách có hiệu quả Big Data thì nó không chỉ giúp tăng lợi nhuận cho chính họ mà còn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm.

Người dùng cuối như mình và các bạn sẽ được hưởng lợi cũng từ việc tối ưu hóa như thế, chứ bản thân chúng ta thì khó mà tự mình phát triển hay mua các giải pháp để khai thác Big Data bởi giá thành của chúng quá đắt, có thể đến cả trăm nghìn đô. Ngoài ra, lượng dữ liệu mà chúng ta có được cũng khó có thể xem là “Big” nếu chỉ có vài Terabyte sinh ra trong một thời gian dài.

Xa hơi một chút, ứng dụng được Big Data có thể giúp các tổ chức, chính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để đầu tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thích tăng trưởng kinh tế, v/v… thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó, giống như trong phim World War Z, nước Israel đã biết trước có dịch zombie nên đã nhanh chóng xây tường thành ngăn cách với thế giới bên ngoài.

Mà cũng không cần nói đến tương lai phim ảnh gì cả, vào năm 2009, Google đã sử dụng dữ liệu Big Data của mình để phân tích và dự đoán xu hướng ảnh hưởng, lan truyền của dịch cúm H1N1 đấy thôi. Dịch vụ này có tên là Google Flu Trends. Xu hướng mà Google rút ra từ những từ khóa tìm kiếm liên quan đến dịch H1N1 đã được chứng minh là rất sát với kết quả do hai hệ thống cảnh báo cúm độc lập Sentinel GP và HealthStat đưa ra. Dữ liệu của Flu Trends được cập nhật gần như theo thời gian thực và sau đó sẽ được đối chiếu với số liệu từ những trung tâm dịch bệnh ở nhiều nơi trên thế giới.

Google_Flu_Trends.
Đường màu xanh là dự đoán của Google Flu Trends dựa trên số từ khóa tìm kiếm liên quan đến các dịch cúm, màu vàng là dữ liệu do cơ quan phòng chống dịch của Mỹ đưa ra.

Còn theo Oracle, việc phân tích Big Data và những dữ liệu dung lượng lớn đã giúp các tổ chức kiếm được 10,66$ cho mỗi 1$ chi phí phân tích, tức là gấp 10 lần! Một trường học ở một quận lớn tại Mỹ cũng có được sự tăng trưởng doanh thulà 8 triệu USD mỗi năm, còn một công ty tài chính ẩn danh khác thì tăng 1000% lợi nhuận trên tổng số tiền đầu tư của mình trong vòng 3 năm.

5. Chỉ trích đối với Big Data

Có hai hướng chỉ trích chính đối với Big Data, một là về cách mà người ta sử dụng Big Data, cái còn lại thì liên quan đến việc tiến hành lấy thông tin từ Big Data mà thế giới đang làm.

A. Chỉ trích về Big Data

Chris Anderson, một nhà khởi nghiệp và cũng là một người viết sách, cho rằng việc sử dụng Big Data luôn cần phải được ngữ cảnh hóa trong các bối cảnh về xã hội, kinh tế và chính trị. Ví dụ, ngay cả khi các công ty đã đầu tư hàng tỉ USD vào Big Data và lấy được thông tin về nhiều thứ nhưng chỉ có ít hơn 40% nhân viên thật sự có thể hiểu và tận dụng các thông tin này. Điều đó làm giảm hiệu quả của Big Data đi nhiều so với lúc đầu, dẫn đến lãng phí tài nguyên.

Ngoài ra, còn có chỉ trích rằng Big Data chỉ có thể miêu tả thế giới trong quá khứ bởi nó dựa trên các dữ liệu đã sinh ra từ trước, và nếu tốt lắm thì chỉ miêu tả được trong hiện thực. Việc sử dụng Big Data để nói về tương lai thì cần phải kết hợp thêm với các phương pháp mô hình, mô phỏng hay nghiên cứu về sự chuyển động của thế giới thì mới đưa ra dự đoán chính xác được.

Bên cạnh đó, người ta còn lo lắng về vấn đề quyền riêng tư của người dùng. Việc thu thập Big Data có thể sẽ đi kèm thông tin có khả năng định dạng người dùng mà không được sự đồng ý của họ, và điều đó vi phạm luật ở một số quốc gia. Nhiều chuyên gia từ nhiều lĩnh vực khác nhau hiện đang thúc đẩy việc bảo vệ quyền riêng tư khi sử dụng Big Data.

B. Chỉ trích về việc lấy thông tin từ Big Data

Nhà nghiên cứu Danah Boyd đã đưa ra quan ngại của mình rằng việc sử dụng Big Data trong việc chọn mẫu thống kê có thể gây ra sự chủ quan, và dù ít hay nhiều thì nó cũng có thể ảnh hưởn đến kết quả cuối cùng. Việc khai thác dữ liệu từ một số nguồn là Big Data, trong khi những nguồn khác không phải là “dữ liệu lớn” thì đặt ra những thách thức khi phân tích dữ liệu.

6. Tương lai của Big Data

Erik Swan, đồng sáng lập kiêm giám đốc công nghệ của công ty Spunk, dự đoán rằng sự thay đổi nhất trong Big Data chính là thái độ của mọi người đối với nó. Việc tiêu thụ một lượng dữ liệu lớn sẽ dần phổ biến hơn với mọi người, từ những người nông dân cho đến các anh kĩ sư. Mọi người sẽ mặc định sử dụng dữ liệu để phân tích mọi thứ trong vòng 10 năm tới. Tất nhiên là kĩ thuật và công nghệ cũng cần phải phát triển theo thì điều này mới có thể trở thành hiện thực.

Còn theo Ankur Jain, nhà sáng lập và CEO của Humin, ngữ cảnh phát sinh ra dữ liệu sẽ trở nên quan trọng hơn. “Chúng ta sẽ bắt đầu định tuyến dữ liệu vào các đối tượng, sự vật, sự việc trong đời thực và chuyện đó giúp chúng ta xử lí công việc tốt hơn”.

Big_Data_problem.

Trong khi đó, Daniel Kaufman, giám đốc đổi mới về thông tin của cơ quan nghiên cứu thuộc Bộ quốc phòng Mỹ thì cho rằng dữ liệu sinh học sẽ ngày càng được quan tâm hơn, và rồi người ta sẽ dùng dữ liệu này để đưa ra những lời khuyên có ảnh hưởng lớn đến lối sống và cuộc đời của con người. Ví dụ, bạn có nên thêm một dĩa cơm tấm sườn nữa không, hay là nên ăn thêm một dĩa cơm gà? Bộ quốc phòng Mỹ muốn sử dụng kiểu suy nghĩ như thế (thay cơm bằng pizza nhé) để áp dụng cho binh lính của mình và hiện họ đang thử nghiệm trên chuột.

Giám đốc Swan còn suy nghĩ thêm rằng các công ty chuyên cung cấp giải pháp Big Data sẽ không còn bán dữ liệu và phân tích cho từng doanh nghiệp hay công ty riêng lẻ để phục vụ cho những mục đích quá chuyên biệt. Thay vào đó, họ sẽ mở rộng nó và áp dụng Big Data nhằm giải quyết những vấn đề trong đời thường và trả lời cho các nhu cầu cơ bản của con người. Đó sẽ là sự thay đổi về tính ứng dụng của Big Data.

Trong tương lai, chúng ta sẽ còn tiếp tục chứng kiến sự tăng trưởng của Big Data. Hiện nay có thể bạn cũng đã nghe đến khái niệm Internet of Things, tức là mang Internet đến với mọi thứ trong đời sống hằng ngày. Dữ liệu từ Internet of Things thực chất cũng là được thu thập từ một mạng lưới rất nhiều các cảm biến và thiết bị điện tử, và nó cũng là một trong những nguồn của Big Data. Lượng dữ liệu khổng lồ này có thể cho các nhà nghiên cứu biết được hành vi tiêu dùng của khách hàng, từ đó tinh chỉnh những thiết bị Internet of Things cho phù hợp hơn, bắt chúng phục vụ đời sống hằng ngày của chúng ta một cách hiệu quả hơn. Nó cũng có thể được dùng cho việc sản xuất, từ đó giảm sự liên quan của con người. Như lời của Daniel Kaufman dự đoán thì “con người sẽ làm ít hơn” nhờ Big Data.

7. Kết

Tóm lại, Big Data là thách thức đặt ra cho các tổ chức, doanh nghiệp trong thời đại số hiện nay. Một khi làm chủ được dữ liệu lớn thì họ sẽ có cơ hội thành công lớn hơn trong bối cảnh cạnh tranh ngày nay, thế giới thì sẽ được hưởng lợi hơn từ việc trích xuất thông tin một cách chính xác hơn, hữu ích hơn với chi phí thấp hơn. Vẫn còn đó những chỉ trích xoay quanh Big Data, tuy nhiên lĩnh vực này vẫn còn rất mới và chúng ta hãy chờ xem trong tương lai Big Data sẽ tiến hóa như thế nào.