Google NotebookLM, trợ lý nghiên cứu được hỗ trợ bởi AI, đã mang đến vô vàn tính năng hữu ích, và trong số đó, Audio Overviews nổi bật như một bổ sung đột phá. Nếu bạn chưa từng trải nghiệm NotebookLM, tính năng này cho phép bạn biến các nguồn tài liệu của mình thành một tập podcast do hai MC ảo dẫn dắt. Chúng không chỉ hấp dẫn, dễ nghe mà còn được lồng ghép sự dí dỏm và hài hước, giúp biến những chủ đề khô khan nhất trở nên thú vị và dễ tiếp thu hơn bao giờ hết.
Từ khi NotebookLM ra mắt dưới dạng dự án thử nghiệm, và đặc biệt là tính năng Audio Overviews được giới thiệu vào tháng 9 năm 2024, tôi đã liên tục sử dụng chúng. Ban đầu, tính năng này tận dụng sức mạnh của Gemini 1.5 Pro nhưng lại bị giới hạn chỉ trong giao diện NotebookLM, một điều khá lạ lùng. Phải đến tháng 3 năm 2025, Google mới chính thức đưa Audio Overviews lên Gemini. Mặc dù đã vài tuần trôi qua kể từ đó, tôi vẫn chưa thử nghiệm và trung thành với phiên bản NotebookLM… cho đến gần đây. Và thật bất ngờ, Gemini Audio Overviews đã nâng tầm trải nghiệm vốn đã ấn tượng này lên một đẳng cấp mới.
Giao diện đăng ký NotebookLM trên iPad với thông tin giới thiệu tính năng Audio Overviews
Audio Overviews Của Gemini Và NotebookLM: Khái Niệm Cốt Lõi Và Khác Biệt Ban Đầu
Về cơ bản, ý tưởng cốt lõi của Audio Overviews không hề thay đổi giữa NotebookLM và Gemini. Cả hai đều được trang bị bởi Gemini và đều tạo ra các bản tóm tắt âm thanh theo phong cách podcast với hai MC AI. Tuy nhiên, trải nghiệm sử dụng Audio Overviews trong Gemini lại có những điểm khác biệt tinh tế, và ở một số khía cạnh, chúng vượt trội hơn hẳn.
Sức mạnh Gemini 1.5 Pro: Nền tảng chung cho trải nghiệm âm thanh
Dù là NotebookLM hay Gemini, tính năng Audio Overviews đều kế thừa sức mạnh từ mô hình ngôn ngữ tiên tiến Gemini 1.5 Pro. Điều này đảm bảo rằng các bản podcast được tạo ra có chất lượng cao, giọng điệu tự nhiên và khả năng diễn đạt thông tin mạch lạc, dễ hiểu. Mục tiêu chung của cả hai phiên bản là biến những khối kiến thức lớn, phức tạp thành nội dung âm thanh hấp dẫn, giúp người dùng tiếp cận thông tin một cách hiệu quả hơn, đặc biệt trong học tập và nghiên cứu. Sự kết hợp giữa công nghệ AI tiên tiến và cách trình bày giống như một chương trình podcast thực thụ đã tạo nên một trải nghiệm độc đáo, giúp giảm bớt gánh nặng khi phải đọc các tài liệu dày đặc.
Từ giới hạn NotebookLM đến sự linh hoạt của Gemini
Để sử dụng bất kỳ tính năng nào trong NotebookLM, bạn cần tạo một “sổ tay” (notebook) và thêm các nguồn tài liệu vào đó. Sau khi hoàn tất, bạn có thể nhấp vào nút Generate dưới mục Audio Overview để tạo podcast AI từ các nguồn đã chọn. Đối với Audio Overviews, đó là tất cả những gì bạn có thể làm trong NotebookLM – mọi bản tóm tắt âm thanh đều được tạo ra chỉ từ những tài liệu bạn đã tải lên sổ tay của mình.
Gemini đã tiến một bước xa hơn. Trong khi Audio Overviews của Gemini cũng có thể chuyển đổi tài liệu bạn tải lên thành bản tóm tắt âm thanh, nó còn có khả năng chuyển đổi các báo cáo Deep Research (Nghiên cứu Chuyên sâu) thành các cuộc thảo luận âm thanh theo phong cách podcast. Điều này có nghĩa là Audio Overviews của Gemini không chỉ bị giới hạn bởi các nguồn bạn cung cấp. Mặc dù điều này có thể làm tăng khả năng “ảo giác” (hallucination) của AI so với NotebookLM, tôi nhận thấy sự linh hoạt bổ sung này rất đáng giá, đặc biệt khi bạn muốn có một cái nhìn tổng quan rộng hơn về một chủ đề, vượt ra ngoài các tài liệu riêng của bạn.
Màn hình giao diện Gemini hiển thị quá trình tạo Audio Overview từ tài liệu hoặc báo cáo Deep Research
Tốc độ và chiều sâu: Gemini cho tổng quan nhanh, NotebookLM cho chi tiết
Một điểm khác biệt đáng chú ý mà tôi đã nhận thấy là các bản Audio Overviews của Gemini thường ngắn hơn đáng kể so với những gì bạn nhận được từ NotebookLM, ngay cả khi bạn sử dụng cùng một nguồn tài liệu. Do đó, tôi đã sử dụng Gemini’s Audio Overviews khi muốn có một cái nhìn tổng quan nhanh chóng và súc tích, còn NotebookLM lại là lựa chọn ưu tiên khi tôi cần một bản tóm tắt sâu rộng và chi tiết hơn. Sự khác biệt về thời lượng này giúp người dùng linh hoạt hơn trong việc lựa chọn công cụ phù hợp với mục đích và thời gian của mình.
NotebookLM đang hiển thị các tài liệu và tính năng tạo Audio Overviews trên màn hình laptop, minh họa cách người dùng quản lý nguồn thông tin
Gemini Audio Overviews: Đột Phá Với Tính Năng Deep Research
Điều thực sự hấp dẫn tôi đến với Audio Overviews trong Gemini chính là khả năng tích hợp của nó với tính năng Deep Research (Nghiên cứu Chuyên sâu). Nếu bạn chưa từng sử dụng Deep Research của Gemini, thì nó hoạt động đúng như tên gọi của mình. Bạn cung cấp cho Gemini các chi tiết về chủ đề muốn nghiên cứu, nó sẽ xây dựng một kế hoạch nghiên cứu, phân tích kết quả và sau đó tạo ra một báo cáo toàn diện.
Deep Research của Gemini: Nâng tầm khả năng nghiên cứu tự động
Ví dụ, trong một thử nghiệm, tôi đã yêu cầu Gemini sử dụng Deep Research để tiến hành nghiên cứu về XDA. Nó đã đưa ra một kế hoạch 8 bước, bắt đầu từ việc nghiên cứu lịch sử và sứ mệnh nền tảng của trang web, và kết thúc bằng mức độ liên quan hiện tại của XDA. Deep Research đánh giá hàng chục trang web, bao gồm cả các diễn đàn cộng đồng như Reddit, điều này thực sự giúp nó vẽ nên một bức tranh toàn diện về chủ đề. Trong quá trình Gemini tiến hành nghiên cứu, nó thậm chí còn hiển thị toàn bộ quá trình tư duy, phương pháp nghiên cứu đang áp dụng và nơi nó thu thập thông tin. Chẳng hạn, trong trường hợp này, nó đã nghiên cứu 104 trang web, bao gồm Reddit, MuckRack, YouTube và nhiều nguồn khác.
Chuyển đổi báo cáo “khủng” thành podcast chỉ với một cú nhấp
Vấn đề là các báo cáo mà Deep Research tạo ra có độ chuyên sâu rất cao. Báo cáo cuối cùng mà Gemini tạo ra trong ví dụ này dài tới mười chín trang! Đây chính là lúc Audio Overviews của Gemini phát huy tác dụng. Thay vì phải đọc hàng chục trang văn bản, bạn có thể chuyển đổi báo cáo đó thành một bản podcast ngay trong Gemini.
Trước khi Google thêm Audio Overviews vào giao diện Gemini, tôi thường phải tải báo cáo Deep Research về, tạo một sổ tay mới trong NotebookLM, tải báo cáo lên làm nguồn, rồi mới tạo Audio Overview. Giờ đây, với Audio Overviews được tích hợp trực tiếp vào Gemini, sự phiền phức đó đã biến mất. Sau khi báo cáo của bạn được tạo, tất cả những gì bạn cần làm là nhấp vào nút Create và chọn Audio Overview từ menu thả xuống. Tôi đã sử dụng phương pháp này khi muốn vượt ra ngoài các nguồn tài liệu của mình mà không bị giới hạn bởi những gì đã tải lên sổ tay.
Hạn Chế Của Gemini Audio Overviews: Những Điểm Còn Kém Hơn NotebookLM
Mặc dù Gemini Audio Overviews mang đến nhiều ưu điểm vượt trội, đặc biệt là khả năng tích hợp với Deep Research, nhưng điều đó không có nghĩa là chúng hoàn toàn tốt hơn NotebookLM. Gemini Audio Overviews vẫn còn thiếu một số tính năng mà NotebookLM đã có.
Thiếu chế độ tương tác đa chiều
Ví dụ, trong NotebookLM, bạn có thể sử dụng chế độ tương tác để “nhảy” vào podcast, đặt câu hỏi hoặc chia sẻ ý kiến của mình. Tôi thấy điều này cực kỳ hữu ích cho việc học tập và nghiên cứu, vì nó tạo ra một môi trường đối thoại hai chiều, giúp người dùng đào sâu kiến thức. Ngược lại, Audio Overviews của Gemini hiện tại chỉ là trải nghiệm nghe một chiều, hạn chế khả năng tương tác trực tiếp của người dùng với nội dung. Điều này có thể khiến việc tiếp thu thông tin trở nên thụ động hơn, đặc biệt khi người dùng muốn làm rõ một điểm nào đó hoặc khám phá thêm các khía cạnh liên quan.
Nút "Join" để tham gia chế độ tương tác của Audio Overview trong NotebookLM, cho phép người dùng đặt câu hỏi và thảo luận trực tiếp
Thời lượng và khả năng tùy chỉnh hạn chế
Ngoài ra, như đã đề cập ở trên, các bản Audio Overviews của Gemini thường ngắn hơn đáng kể so với NotebookLM. Phiên bản NotebookLM thậm chí còn cho phép bạn lựa chọn giữa các bản tóm tắt âm thanh “ngắn hơn” hoặc “dài hơn”, mang lại sự linh hoạt đáng kể trong việc kiểm soát độ chi tiết. Tuy nhiên, Gemini lại không cung cấp bất kỳ tùy chọn nào để kiểm soát độ dài của bản âm thanh. Ví dụ, bản Audio Overview Gemini tạo ra từ báo cáo Deep Research dài 19 trang chỉ có vỏn vẹn sáu phút. Điều này có thể là một hạn chế đối với những người dùng cần một bản tóm tắt sâu hơn hoặc muốn kiểm soát chính xác lượng thông tin được trình bày.
Nếu bạn đã quen thuộc với Audio Overviews của NotebookLM và vẫn chưa thử nghiệm Gemini, nghĩ rằng chúng chỉ là một (như tôi đã từng nghĩ trong một thời gian dài), thì bạn đang bỏ lỡ một trải nghiệm tuyệt vời, đặc biệt là khi nói đến tính năng Deep Research.
Kết Luận: Lựa Chọn Nào Tối Ưu Cho Nhu Cầu Của Bạn?
Cuộc so sánh giữa Gemini Audio Overviews và NotebookLM cho thấy mỗi nền tảng đều có những ưu điểm và hạn chế riêng, phù hợp với các nhu cầu khác nhau của người dùng. NotebookLM nổi bật với khả năng tương tác sâu rộng và tùy chỉnh độ dài linh hoạt, mang lại trải nghiệm học tập và nghiên cứu chi tiết, có chiều sâu. Trong khi đó, Gemini Audio Overviews lại ghi điểm với sự tích hợp mạnh mẽ với Deep Research, khả năng biến các báo cáo nghiên cứu đồ sộ thành podcast dễ tiếp thu chỉ với một cú nhấp chuột, và tốc độ tạo tổng quan nhanh chóng.
Dù Gemini Audio Overviews còn thiếu một số tính năng tương tác và tùy chỉnh độ dài so với NotebookLM, nhưng khả năng đột phá của nó trong việc xử lý các báo cáo Deep Research là không thể phủ nhận. Nó loại bỏ các bước thủ công rườm rà, giúp người dùng tiết kiệm đáng kể thời gian và công sức trong quá trình nghiên cứu.
Nếu bạn là người thường xuyên phải xử lý các báo cáo dài, muốn có cái nhìn tổng quan nhanh chóng và không ngại bỏ qua chế độ tương tác trực tiếp, Gemini Audio Overviews chắc chắn là một công cụ đáng để trải nghiệm. Ngược lại, nếu bạn ưu tiên sự tương tác, khả năng tùy chỉnh chi tiết và cần một bản tóm tắt sâu hơn từ các nguồn tài liệu của mình, NotebookLM vẫn là lựa chọn tối ưu.
Đừng ngần ngại khám phá và thử nghiệm cả hai công cụ này để tìm ra trợ lý AI tóm tắt âm thanh phù hợp nhất với phong cách làm việc và học tập của bạn. Chia sẻ trải nghiệm của bạn với chúng tôi tại caphecongnghe.com để cộng đồng cùng thảo luận nhé!