Submissions from github.com/santosardr

		RIS-Kernel: Running 64k context LLMs on CPU via sparse attention (github.com/santosardr)
		2 points by santosardr 11 hours ago \| past \| discuss