How grading exam papers is related to AI

less than 1 minute read

Published:

đi chấm thi chấm được 1 nửa rồi thì phát hiện ra là đáp án sai @@ ĐCM!

đi chấm thi, nghĩ về cách mà LLMs đang được evaluate no fair evaluation, cũng như vấn đề của các benchmarks hiện tại. Nhiều lỗi, và ko representative, thiên vị, bla blo và bản chất của cuộc chơi của các mô hình “nhỏ” thắng được các mô hình lớn trong các task với 1 số mẹo -> giống con nhà nghèo học giỏi thôi. Ko nhìn được tương lai, chỉ học giỏi để kiếm tiền và đầu tư cho thế hệ sau

đi chấm thi ban đầu chấm lâu, sau đó chấm nhanh hơn. Finetune mô hình

multiple round evaluation, not just F1 or Accuracy

Leave a Comment