Đặc tả Tính năng: Trích dẫn & Xem trước
1. Tổng quan & Tầm nhìn
Trích dẫn & Xem trước là lớp minh bạch của AI Assistant. Nó liên kết văn bản do AI tạo ra với tài liệu nguồn gốc, cho phép người dùng xác minh mọi tuyên bố của chatbot. Bằng cách cung cấp các liên kết trực tiếp, có thể nhấp vào các đoạn văn bản cụ thể, nó xây dựng niềm tin và ngăn ngừa các rủi ro liên quan đến ảo giác AI trong môi trường doanh nghiệp.
2. Các Vai trò & Bên liên quan
| Vai trò | Mục tiêu |
|---|---|
| Thành viên | Xác minh các câu trả lời của AI và đọc toàn bộ ngữ cảnh của một chính sách hoặc báo cáo. |
| Cán bộ Tuân thủ | Đảm bảo các phản hồi của AI được căn cứ chính xác vào các tài liệu chính thức. |
3. Câu chuyện Người dùng (User Stories)
- Với tư cách là người dùng, tôi muốn nhấp vào một số thứ tự
[1]trong câu trả lời của AI để có thể xem chính xác đoạn văn mà nó đã đọc trong "Sổ tay nhân viên". - Với tư cách là thành viên, tôi muốn di chuột qua một trích dẫn để xem tiêu đề tài liệu trước khi nhấp vào.
- Với tư cách là người dùng, tôi muốn có một bảng xem trước bên cạnh để không phải rời khỏi cuộc trò chuyện mà vẫn đọc thêm được nội dung.
4. Yêu cầu Chức năng (FR)
- REQ-CIT-001: Đánh số trích dẫn nội dòng trong các phản hồi do AI tạo ra.
- REQ-CIT-002: Tự động ánh xạ các vector chunk tới các nguồn cha của chúng.
- REQ-CIT-003: Bảng điều khiển bên "Xem trước đoạn văn" với các phần làm nổi bật văn bản theo ngữ cảnh.
- REQ-CIT-004: Các badge nguồn có thể nhấp vào, liên kết tới các trang ứng dụng Drive hoặc Document.
5. Yêu cầu Phi chức năng (NFR)
- Độ trễ: Truy xuất siêu dữ liệu trích dẫn < 100ms.
- Độ chính xác: Độ chính xác 100% trong việc liên kết các chunk với ID nguồn chính xác.
6. Logic & Quy tắc Nghiệp vụ
- Prompt Engineering: LLM được hướng dẫn để xuất ra các trích dẫn theo một định dạng cụ thể (ví dụ:
[[sourceId]]). - Khử trùng lặp: Nếu nhiều chunk từ cùng một nguồn được sử dụng, chúng được nhóm dưới một số trích dẫn duy nhất hoặc được liệt kê riêng lẻ dựa trên khoảng cách đoạn văn.
- Tính sẵn sàng: Trích dẫn chỉ được hiển thị nếu tài liệu nguồn vẫn tồn tại trong hệ thống.
7. Giao diện Người dùng (UI/UX)
- Badge tin nhắn: Các badge số nhỏ
[1],[2]bên cạnh các câu văn. - Danh sách trích dẫn: Vùng chân trang dưới mỗi phản hồi của trợ lý hiển thị tất cả các nguồn đã sử dụng.
- Bảng bên: Ngăn kéo trượt ra hiển thị đoạn văn bản thô và liên kết "Xem bản gốc".
8. Kiến trúc Thông tin
- Được tích hợp trực tiếp vào giao diện Chat.
- Trạng thái bảng xem trước nằm trong phạm vi phiên làm việc.
9. Mô hình Dữ liệu & Lưu trữ
- Bảng:
chat_messages(cột trích dẫn được lưu dưới dạng jsonb). - Tra cứu: Join bảng
kb_chunksvàkb_sourcesđể truy xuất siêu dữ liệu.
10. Lớp API & Dịch vụ
GET /chunks/:id(Truy xuất văn bản thô để xem trước).- Các trích dẫn được bao gồm trong payload tin nhắn của
GET /sessions/:id/messages.
11. Các Mẫu Tích hợp
- Trình render Markdown: Thành phần React tùy chỉnh để phân tích các thẻ
[[sourceId]]thành các badge UI tương tác. - Liên kết sâu: Các liên kết đến tệp
Drivesử dụng mẫu URL tuyệt đối của module.
12. Bảo mật & Quyền hạn
- RBAC: Quyền
ai_assistant:chatbao gồm quyền truy cập vào siêu dữ liệu trích dẫn. - Cô lập: Người dùng chỉ có thể xem trước các chunk từ các nguồn thuộc về
organizationIdcủa họ.
13. Xử lý Lỗi & Khả năng Phục hồi
- Thiếu nguồn: Nếu một nguồn đã bị xóa sau cuộc trò chuyện, hiển thị "Nguồn không còn khả dụng" trong bản xem trước.
- Lỗi định dạng: Ẩn trích dẫn một cách mượt mà nếu LLM không tuân thủ định dạng gắn thẻ.
14. Hiệu năng & Khả năng Mở rộng
- Siêu dữ liệu trích dẫn được đóng gói kèm theo tin nhắn để tránh các yêu cầu khứ hồi.
- Tối ưu hóa đánh chỉ mục cơ sở dữ liệu cho các lần tra cứu siêu dữ liệu nguồn.
15. Toàn cầu hóa & Bản địa hóa
- Hỗ trợ các nhãn "Nguồn" và "Xem trước" bằng EN/VI.
16. Khả năng Tiếp cận (a11y)
- Nhãn Aria cho các badge trích dẫn mô tả tài liệu được liên kết.
- Bảng bên có thể truy cập bằng bàn phím (phím Esc để đóng).
17. Khả năng Quan sát & Phân tích
- Theo dõi "Tỷ lệ nhấp vào trích dẫn" (CTR) để đo lường hành vi xác minh của người dùng.
18. Kiểm thử & Chất lượng
- Kiểm thử đơn vị Regex cho việc phân tích thẻ trích dẫn.
- Kiểm thử UI cho hiệu ứng trượt bảng bên và logic cuộn-đến-phần-làm-nổi-bật.
19. Các Ràng buộc & Giả định
- Giả định LLM tuân thủ đúng hướng dẫn hệ thống "Trích dẫn nguồn của bạn".
20. Các Cải tiến Tương lai
- Làm nổi bật văn bản trực quan bên trong trình xem PDF/Doc gốc.
- Các biểu tượng "Điểm tin cậy" bên cạnh mỗi trích dẫn.