How grading exam papers is related to AI
Published:
đi chấm thi chấm được 1 nửa rồi thì phát hiện ra là đáp án sai @@ ĐCM!
đi chấm thi, nghĩ về cách mà LLMs đang được evaluate no fair evaluation, cũng như vấn đề của các benchmarks hiện tại. Nhiều lỗi, và ko representative, thiên vị, bla blo và bản chất của cuộc chơi của các mô hình “nhỏ” thắng được các mô hình lớn trong các task với 1 số mẹo -> giống con nhà nghèo học giỏi thôi. Ko nhìn được tương lai, chỉ học giỏi để kiếm tiền và đầu tư cho thế hệ sau
đi chấm thi ban đầu chấm lâu, sau đó chấm nhanh hơn. Finetune mô hình
multiple round evaluation, not just F1 or Accuracy
Leave a Comment