LLMs là viết tắt của cụm từ tiếng Anh Large Language Models, có nghĩa là Mô hình Ngôn ngữ Lớn.
Bạn có thể hình dung LLM như một "bộ não" AI cực kỳ lớn, được tạo ra để chuyên xử lý các nhiệm vụ liên quan đến ngôn ngữ của con người. Để làm được điều này, nó đã được "học" từ một khối lượng dữ liệu văn bản khổng lồ (sách, báo, toàn bộ nội dung trên Internet...).
Những đặc điểm chính của LLMs:
Hiểu ngôn ngữ tự nhiên: Chúng có thể hiểu được ngữ pháp, ngữ cảnh, ý nghĩa, và thậm chí cả những sắc thái tinh tế trong cách con người giao tiếp.
Tạo ra văn bản mới: Dựa trên những gì đã học, chúng có thể tự viết ra các đoạn văn bản mới, mạch lạc và tự nhiên như người thật viết.
Khả năng đa nhiệm: Một LLM có thể thực hiện rất nhiều tác vụ khác nhau như dịch thuật, tóm tắt văn bản, trả lời câu hỏi, viết email, sáng tác thơ, và thậm chí là viết mã lập trình.
Ví dụ điển hình của các sản phẩm sử dụng LLMs: ChatGPT của OpenAI, Gemini của Google.
Prompting (động từ của "prompt") là hành động ra lệnh, đưa ra yêu cầu hoặc gợi ý cho một mô hình AI (như LLM) để nó thực hiện một nhiệm vụ cụ thể.
Nói một cách đơn giản, prompt chính là những gì bạn gõ vào ô chat để yêu cầu AI làm một việc gì đó. Nó là phương tiện giao tiếp duy nhất giữa bạn và AI.
Ví dụ về prompt:
Một prompt đơn giản: "Thủ đô của Việt Nam là gì?"
Một prompt phức tạp hơn: "Hãy viết một email chuyên nghiệp gửi cho khách hàng để thông báo về việc sản phẩm sẽ được giao chậm 2 ngày, nêu rõ lý do là vì vấn đề vận chuyển và đề xuất một phương án đền bù hợp lý."
Chất lượng của câu trả lời từ AI phụ thuộc rất nhiều vào chất lượng của prompt. Một prompt rõ ràng, chi tiết và có đầy đủ ngữ cảnh sẽ giúp AI hiểu đúng yêu cầu và đưa ra kết quả chính xác, hữu ích hơn. Kỹ năng viết prompt hiệu quả đang ngày càng trở nên quan trọng và được gọi là Prompt Engineering (Kỹ thuật tạo câu lệnh).
Đây là những phương pháp cơ bản để "hướng dẫn" các mô hình ngôn ngữ lớn (LLM) thực hiện nhiệm vụ một cách hiệu quả.
Điểm cốt lõi để phân biệt giữa zero-shot, one-shot, và few-shot là số lượng ví dụ bạn cung cấp cho AI trong câu lệnh (prompt).
Đây là kỹ thuật đơn giản nhất. Bạn chỉ cần ra lệnh trực tiếp cho AI làm một việc gì đó mà không cần cung cấp bất kỳ ví dụ mẫu nào. AI phải hoàn toàn dựa vào kiến thức đã được huấn luyện trước đó để hiểu và thực hiện yêu cầu.
Đặc điểm: Nhanh, gọn, đơn giản.
Khi nào dùng: Cho các tác vụ phổ biến, đơn giản mà AI có khả năng đã được học rất kỹ (ví dụ: dịch thuật, tóm tắt, trả lời câu hỏi kiến thức chung).
Hạn chế: Độ chính xác có thể không cao với các nhiệm vụ phức tạp hoặc yêu cầu định dạng cụ thể.
Ví dụ:
Prompt: Phân loại cảm xúc của câu sau thành Tích cực, Tiêu cực hoặc Trung tính: "Bộ phim này có kỹ xảo đẹp nhưng cốt truyện thì khá dễ đoán."
Trong ví dụ này, bạn không hề cho AI biết một câu "Tích cực" hay "Tiêu cực" trông như thế nào. Bạn tin tưởng rằng nó đã biết cách làm.
Với kỹ thuật này, bạn đưa ra yêu cầu kèm theo một ví dụ mẫu duy nhất. Ví dụ này giúp AI "hiểu" rõ hơn về định dạng đầu ra hoặc bối cảnh của nhiệm vụ bạn muốn.
Đặc điểm: Cải thiện độ chính xác so với Zero-shot, giúp định hướng AI tốt hơn.
Khi nào dùng: Khi bạn cần kết quả có cấu trúc cụ thể hoặc khi nhiệm vụ hơi mới lạ với AI.
Ví dụ:
Prompt: Dịch các câu sau sang tiếng Anh:
Câu tiếng Việt: "Xe màu đỏ thì đắt tiền." Câu tiếng Anh: "The red car is expensive."
Bây giờ, hãy dịch câu này: Câu tiếng Việt: "Bầu trời hôm nay thật trong xanh." Câu tiếng Anh:
Ở đây, ví dụ đầu tiên giúp AI hiểu rằng bạn muốn một bản dịch trực tiếp theo cấu trúc "Câu tiếng Việt -> Câu tiếng Anh".
Đây là phiên bản nâng cao của One-shot, bạn cung cấp cho AI nhiều hơn một ví dụ (thường là từ 2 đến 5 ví dụ). Việc cung cấp nhiều ví dụ giúp AI nhận diện các quy luật, mẫu phức tạp và tạo ra kết quả nhất quán, chính xác hơn.
Đặc điểm: Độ chính xác cao nhất trong ba kỹ thuật, đặc biệt hiệu quả với các tác vụ phức tạp.
Khi nào dùng: Cho các nhiệm vụ đòi hỏi sự tinh tế, có nhiều quy tắc ngầm hoặc cần tuân theo một định dạng rất nghiêm ngặt.
Hạn chế: Tốn nhiều không gian trong prompt (tăng số lượng token sử dụng).
Ví dụ:
Prompt: Phân loại các mặt hàng sau vào danh mục "Trái cây" hoặc "Rau củ":
Cà chua -> Rau củ
Táo -> Trái cây
Bông cải xanh -> Rau củ
Cam -> Trái cây
Dưa chuột ->
Bằng cách đưa ra nhiều ví dụ, bạn giúp AI hiểu rõ hơn ranh giới phân loại (ví dụ như cà chua về mặt thực vật học là trái cây nhưng trong ẩm thực lại là rau củ).
Đây là một kỹ thuật nâng cao, không chỉ tập trung vào việc cung cấp ví dụ mà còn yêu cầu AI phải suy luận từng bước một trước khi đưa ra câu trả lời cuối cùng. Thay vì trả lời ngay lập tức, AI sẽ trình bày rõ ràng quá trình tư duy của nó.
Đặc điểm: Tăng cường đáng kể khả năng suy luận logic, giải quyết các bài toán phức tạp, giảm thiểu lỗi sai. Giúp người dùng hiểu được "tại sao" AI lại đưa ra kết quả đó.
Khi nào dùng: Các bài toán logic, toán học, câu hỏi suy luận nhiều bước, hoặc bất kỳ nhiệm vụ phức tạp nào mà việc chia nhỏ vấn đề sẽ giúp giải quyết dễ dàng hơn.
Ví dụ:
Prompt: Roger có 5 quả bóng tennis. Anh ấy mua thêm 2 hộp bóng tennis, mỗi hộp có 3 quả. Hỏi bây giờ anh ấy có bao nhiêu quả bóng? Hãy suy nghĩ từng bước một.
Phản hồi mong đợi từ AI (sử dụng CoT):
Chắc chắn rồi, hãy cùng phân tích từng bước:
Roger ban đầu có 5 quả bóng.
Anh ấy mua thêm 2 hộp bóng, mỗi hộp có 3 quả. Vậy số bóng anh ấy mua thêm là: 2 hộp * 3 quả/hộp = 6 quả.
Tổng số bóng Roger có bây giờ là số bóng ban đầu cộng với số bóng mua thêm: 5 + 6 = 11 quả.
Vậy, Roger có tổng cộng 11 quả bóng tennis.
Kỹ thuật này buộc AI phải "chậm lại", phân tích bài toán thay vì đưa ra một con số ngay lập tức, nhờ đó tăng độ chính xác lên rất nhiều. Nó có thể được kết hợp với các kỹ thuật trên, ví dụ như Zero-shot CoT (chỉ cần thêm câu "Hãy suy nghĩ từng bước một" vào cuối prompt) hoặc Few-shot CoT (cung cấp các ví dụ có kèm theo cả quá trình suy luận).
Việc sử dụng cấu trúc Persona - Task - Context - Format là một phương pháp chuyên nghiệp để "điều khiển" các mô hình ngôn ngữ lớn như Gemini, giúp bạn nhận được kết quả chính xác, phù hợp và hữu ích nhất.
Mô tả ngắn gọn về phương pháp P-T-C-F
Đây là một khung sườn để xây dựng một câu lệnh (prompt) hiệu quả bằng cách cung cấp cho AI bốn loại thông tin rõ ràng:
Persona (Vai trò): Yêu cầu AI "đóng vai" một chuyên gia hoặc một nhân vật cụ thể. Điều này quyết định đến văn phong, kiến thức nền và góc nhìn của câu trả lời.
Task (Nhiệm vụ): Nêu rõ hành động cụ thể bạn muốn AI thực hiện. Đây là "động từ chính" của câu lệnh. Hãy dùng các động từ mạnh như: phân tích, soạn thảo, so sánh, lên kế hoạch, tạo bảng...
Context (Bối cảnh): Cung cấp toàn bộ thông tin nền cần thiết để AI hiểu rõ tình huống. Bối cảnh càng chi tiết, câu trả lời càng phù hợp. Đây là phần quan trọng nhất để tránh các câu trả lời chung chung.
Format (Định dạng): Chỉ định rõ cách bạn muốn nhận lại kết quả. Điều này giúp bạn tiết kiệm thời gian chỉnh sửa và có được sản phẩm cuối cùng như ý.
Câu prompt ví dụ:
(Persona) Hãy đóng vai một bác sĩ chuyên khoa Dinh dưỡng lâm sàng có kinh nghiệm tư vấn cho bệnh nhân đái tháo đường. (Task) Hãy soạn thảo một kế hoạch thực đơn chi tiết cho 7 ngày. (Context) Bệnh nhân là nam giới, 55 tuổi, nhân viên văn phòng, mới được chẩn đoán đái tháo đường type 2. Bệnh nhân có thói quen ăn ngoài bữa trưa và ít vận động. Mục tiêu là kiểm soát đường huyết, giảm 2kg trong tháng đầu và thực đơn phải dễ chuẩn bị với các nguyên liệu phổ biến ở chợ Việt Nam. (Format) Vui lòng trình bày kết quả dưới dạng một bảng, với các cột: Ngày, Bữa Sáng, Bữa Trưa, Bữa Tối, và Bữa Phụ. Kèm theo một vài lưu ý ngắn gọn ở cuối bảng.
Phân tích từng thành phần:
Persona (Vai trò):
Hãy đóng vai một bác sĩ chuyên khoa Dinh dưỡng lâm sàng có kinh nghiệm tư vấn cho bệnh nhân đái tháo đường.
Tại sao lại quan trọng? Yêu cầu này định hướng cho Gemini sử dụng văn phong của một chuyên gia y tế, đưa ra lời khuyên đáng tin cậy, khoa học và tập trung vào mục tiêu sức khỏe, thay vì chỉ là một người liệt kê món ăn thông thường.
Task (Nhiệm vụ):
Hãy soạn thảo một kế hoạch thực đơn chi tiết cho 7 ngày.
Tại sao lại quan trọng? Đây là mệnh lệnh chính, rõ ràng và cụ thể. AI biết chính xác sản phẩm cần tạo ra là một "kế hoạch thực đơn", không phải là một bài viết chung chung về dinh dưỡng.
Context (Bối cảnh):
Bệnh nhân là nam giới, 55 tuổi, nhân viên văn phòng, mới được chẩn đoán đái tháo đường type 2. Bệnh nhân có thói quen ăn ngoài bữa trưa và ít vận động. Mục tiêu là kiểm soát đường huyết, giảm 2kg trong tháng đầu và thực đơn phải dễ chuẩn bị với các nguyên liệu phổ biến ở chợ Việt Nam.
Tại sao lại quan trọng? Đây là phần "vàng". Nếu không có bối cảnh này, AI sẽ chỉ đưa ra một thực đơn chung chung. Nhờ có nó, AI sẽ điều chỉnh kế hoạch để:
Phù hợp với bệnh lý (ĐTĐ type 2).
Phù hợp với lối sống (nhân viên văn phòng, ít vận động).
Giải quyết vấn đề cụ thể (thói quen ăn ngoài).
Hướng tới mục tiêu rõ ràng (kiểm soát đường huyết, giảm cân).
Mang tính thực tế và văn hóa (nguyên liệu Việt Nam, dễ chuẩn bị).
Format (Định dạng):
Vui lòng trình bày kết quả dưới dạng một bảng, với các cột: Ngày, Bữa Sáng, Bữa Trưa, Bữa Tối, và Bữa Phụ. Kèm theo một vài lưu ý ngắn gọn ở cuối bảng.
Tại sao lại quan trọng? Yêu cầu này giúp bạn nhận được kết quả có cấu trúc, dễ đọc, dễ theo dõi và có thể sử dụng ngay lập tức mà không cần phải định dạng lại.
Bằng cách kết hợp 4 yếu tố này, bạn đã nâng cấp một câu hỏi đơn giản thành một yêu cầu công việc chi tiết, giúp Gemini phát huy tối đa khả năng của mình để phục vụ bạn.