Thư viện ngày gió to, nhìn quanh được 4 chú sinh viên già, quen mặt. Canada dạo này nát thật. Từ 2024, chính phủ hạn chế dân tạm cư, du học sinh quốc tế thưa thớt hẳn.
Tui mất 1h30 để cài đặt và configure viết ra ứng dụng đầu tiên để chọc đến các API của AI platform.
Bài toàn tương đối đơn giản:
"Tui hỏi bằng miệng, AI trả lời"
Ơ hay, thế bình thường khi dùng AI thì không thế à? Haha, bình thường bạn dùng sẵn app của nó, còn đây tui đang tự build cái app đó để customize theo cái ý đồ riêng của tôi để chơi với con robot.
Phân tích flow chương trình về mặt kỹ thuật:
Bạn nói => Module chuyển từ giọng nói sang text => cho cái text này vào AI bằng cách gọi API của AI => nhận response và hiển thị lên màn hình console
Okay, nghe có vẻ đơn giản, giờ ta bắt tay vào làm theo thought process
1. Chọn ngôn ngữ nào?
Mình muốn ăn liền nên python là chuẩn bài = > Python 3.8+
2. Dùng module nào để convert?
Cái nào lightweight rẻ tiền thì dùng, miễn phí càng tốt =>
Để truy cập được vào microphone:
PyAudio – for accessing the microphone.
Để convert giọng nói sang text
Speech Recognition – for converting voice to text.
Thằng này ngon, dùng phát ăn ngay
Whisper
Thằng này thì rẻ và kết hợp được luôn với AI model như OpenRouter
Cơ mà có cái dở là bước làm nó hơi khác. Nó sẽ thu âm thanh vào file wav lưu tại local, sau đó dùng một model AI để transcribe audio sang text.
3. AI thì chọn thằng nào?
Sau một hồi do research thì go with OpenRouter. Nó rẻ, và mình fix được mấy lỗi linh tinh ngu ngốc do AI generate code ra.
Tada.... đây là sản phẩm đầu ra.
Trông dễ vậy thôi cơ mà cũng phải bẩy bẩy bốn chín cái cấu hình và setup nữa nhé các bạn trẻ.
Game là dễ.
Giờ đi làm trận fifa07 tự thưởng cho ouput ngày hôm nay
What's next?
Sau đó đến lượt tống thêm Text to speech để nó nói, rồi tống dữ liệu này ra đường serial bắn sang con arduino điều khiển cái đầu robot.
Xin lỗi các bạn, tôi là dân làm embedded software mà, chơi với PC không thỏa mãn cái thú táy máy của tôi. Tiếp theo là tôi sẽ tìm cách nhúng cái app này vào mấy cái hardware platform như raspberry pi/ jetson nano .. ahihi
Comments
Post a Comment