Đặc tả Tính năng: Hỏi & Đáp Hội thoại
1. Tổng quan & Tầm nhìn
Hỏi & Đáp Hội thoại là giao diện chính để tương tác với tri thức của tổ chức. Nó cung cấp trải nghiệm chatbot bằng ngôn ngữ tự nhiên, tận dụng công nghệ RAG (Thế hệ Tăng cường Truy xuất) để cung cấp các câu trả lời có căn cứ, chính xác và có trích dẫn, đóng vai trò như một chuyên gia thông minh đã đọc mọi tài liệu trong công ty.
2. Các Vai trò & Bên liên quan
| Vai trò | Mục tiêu |
|---|---|
| Thành viên | Nhận được các câu trả lời tức thì, chính xác cho các câu hỏi công việc phức tạp. |
| Quản trị viên Tri thức | Giám sát chất lượng trò chuyện và xác định các lỗ hổng tri thức. |
| Ban điều hành | Tóm tắt nhanh các báo cáo nội bộ và tài liệu chiến lược. |
3. Câu chuyện Người dùng (User Stories)
- Với tư cách là thành viên, tôi muốn hỏi "Chính sách làm việc từ xa của chúng ta cho năm 2025 là gì?" và nhận được một bản tóm tắt trực tiếp thay vì phải đọc một tệp PDF.
- Với tư cách là người dùng, tôi muốn đặt các câu hỏi tiếp nối (ví dụ: "Còn đối với cộng tác viên thì sao?") và trợ lý phải ghi nhớ ngữ cảnh trước đó.
- Với tư cách là nhân viên mới, tôi muốn hỏi "Làm thế nào để thiết lập VPN?" và nhận được hướng dẫn từng bước từ các tài liệu kỹ thuật của chúng tôi.
4. Yêu cầu Chức năng (FR)
- REQ-CHAT-001: Hiểu ngôn ngữ tự nhiên và tạo phản hồi.
- REQ-CHAT-002: Lịch sử trò chuyện đa phiên bền vững cho mỗi người dùng.
- REQ-CHAT-003: Tạo phản hồi dạng luồng (Server-Sent Events).
- REQ-CHAT-004: Trí nhớ ngữ cảnh (10 tin nhắn gần nhất) trong một phiên làm việc.
5. Yêu cầu Phi chức năng (NFR)
- Độ trễ: Thời gian cho token đầu tiên (TTFT) < 2 giây.
- Độ chính xác: AI PHẢI KHÔNG được ảo giác; nó PHẢI thông báo nếu thông tin còn thiếu trong KB.
- Quyền riêng tư: Các cuộc hội thoại là riêng tư tuyệt đối đối với người dùng và tổ chức của họ.
6. Logic & Quy tắc Nghiệp vụ
- Phạm vi Truy xuất: Mọi truy vấn đều kích hoạt một tìm kiếm vector được giới hạn nghiêm ngặt trong
organizationIdcủa người dùng. - Gợi ý Hệ thống: Các hướng dẫn nghiêm ngặt để chỉ trả lời từ ngữ cảnh được cung cấp và bao gồm các trích dẫn.
- Quản lý Phiên: Các phiên trò chuyện được tự động đặt tiêu đề dựa trên truy vấn đầu tiên của người dùng.
7. Giao diện Người dùng (UI/UX)
- Chế độ xem chính: Giao diện tin nhắn với các bong bóng người dùng/trợ lý riêng biệt.
- Thanh bên: Danh sách các phiên trò chuyện gần đây với các hành động "Xóa" và "Đổi tên".
- UI Streaming: Render token động với nút "Dừng".
8. Kiến trúc Thông tin
- Trang đích chính của module.
- "Lịch sử trò chuyện" có thể truy cập qua thanh bên trái.
9. Mô hình Dữ liệu & Lưu trữ
- Bảng:
chat_sessions(Siêu dữ liệu). - Bảng:
chat_messages(Nội dung & Trích dẫn). - Kho lưu trữ Vector: Truy xuất ngữ nghĩa từ
kb_chunks.
10. Lớp API & Dịch vụ
POST /sessions/:id/messages(Điểm cuối streaming).GET /sessions(Danh sách lịch sử).ChatServiceđiều phối đường ống RAG.
11. Các Mẫu Tích hợp
- OpenAI API: Sử dụng GPT-4o / GPT-4o-mini để tạo phản hồi.
- Định danh Shell: Trích xuất tùy chọn và tên người dùng để chào hỏi cá nhân hóa.
12. Bảo mật & Quyền hạn
- RBAC: Yêu cầu quyền
ai_assistant:chatđể sử dụng tính năng. - Cô lập: Người dùng không thể xem hoặc truy cập các phiên trò chuyện thuộc về người dùng khác.
13. Xử lý Lỗi & Khả năng Phục hồi
- LLM Timeout: Thử lại mượt mà hoặc thông báo lỗi ("AI hiện đang bận").
- Không có ngữ cảnh: Phản hồi dự phòng: "Tôi không tìm thấy thông tin liên quan trong cơ sở tri thức của chúng ta."
14. Hiệu năng & Khả năng Mở rộng
- Quản lý cửa sổ ngữ cảnh được tối ưu hóa (cắt tỉa lịch sử dài).
- Đánh chỉ mục chạy ngầm đảm bảo tìm kiếm vector luôn khớp với dữ liệu mới nhất.
15. Toàn cầu hóa & Bản địa hóa
- Hỗ trợ các truy vấn/phản hồi bằng tiếng Việt và tiếng Anh.
- Tự động phát hiện ngôn ngữ (AI phản hồi bằng ngôn ngữ mà người dùng sử dụng).
16. Khả năng Tiếp cận (a11y)
- Vùng Aria-live cho các thông báo văn bản dạng luồng.
- Lịch sử trò chuyện và vùng nhập liệu có thể điều hướng bằng bàn phím.
17. Khả năng Quan sát & Phân tích
- Theo dõi "Số truy vấn mỗi phiên" để đo lường mức độ tương tác của người dùng.
- Giám sát "Tiêu thụ Token" trên mỗi tổ chức.
18. Kiểm thử & Chất lượng
- Các tập dữ liệu đánh giá (Golden Sets) để đo lường độ chính xác của AI.
- Kiểm thử tải cho việc streaming đồng thời cao.
19. Các Ràng buộc & Giả định
- Giả định tổ chức đã thêm ít nhất một nguồn hợp lệ vào Cơ sở Tri thức.
20. Các Cải tiến Tương lai
- Các phiên làm việc chung (trò chuyện cộng tác).
- Tải lên Hình ảnh/Tài liệu trực tiếp vào trò chuyện để làm ngữ cảnh tạm thời.