12874c5fdSThomas Gleixner // SPDX-License-Identifier: GPL-2.0-or-later 261e85e36SJonas Bonn /* 361e85e36SJonas Bonn * OpenRISC fault.c 461e85e36SJonas Bonn * 561e85e36SJonas Bonn * Linux architectural port borrowing liberally from similar works of 661e85e36SJonas Bonn * others. All original copyrights apply as per the original source 761e85e36SJonas Bonn * declaration. 861e85e36SJonas Bonn * 961e85e36SJonas Bonn * Modifications for the OpenRISC architecture: 1061e85e36SJonas Bonn * Copyright (C) 2003 Matjaz Breskvar <phoenix@bsemi.com> 1161e85e36SJonas Bonn * Copyright (C) 2010-2011 Jonas Bonn <jonas@southpole.se> 1261e85e36SJonas Bonn */ 1361e85e36SJonas Bonn 1461e85e36SJonas Bonn #include <linux/mm.h> 1561e85e36SJonas Bonn #include <linux/interrupt.h> 16ce139ab8SPaul Gortmaker #include <linux/extable.h> 173f07c014SIngo Molnar #include <linux/sched/signal.h> 1838caa902SPeter Xu #include <linux/perf_event.h> 1961e85e36SJonas Bonn 207c0f6ba6SLinus Torvalds #include <linux/uaccess.h> 21*d8fee3f6SStafford Horne #include <asm/mmu_context.h> 2261e85e36SJonas Bonn #include <asm/siginfo.h> 2361e85e36SJonas Bonn #include <asm/signal.h> 2461e85e36SJonas Bonn 2561e85e36SJonas Bonn #define NUM_TLB_ENTRIES 64 2661e85e36SJonas Bonn #define TLB_OFFSET(add) (((add) >> PAGE_SHIFT) & (NUM_TLB_ENTRIES-1)) 2761e85e36SJonas Bonn 2861e85e36SJonas Bonn /* __PHX__ :: - check the vmalloc_fault in do_page_fault() 2911648cbbSRandy Dunlap * - also look into include/asm/mmu_context.h 3061e85e36SJonas Bonn */ 318e6d08e0SStefan Kristiansson volatile pgd_t *current_pgd[NR_CPUS]; 3261e85e36SJonas Bonn 339fd5a04dSEric W. Biederman extern void __noreturn die(char *, struct pt_regs *, long); 3461e85e36SJonas Bonn 3561e85e36SJonas Bonn /* 3661e85e36SJonas Bonn * This routine handles page faults. It determines the address, 3761e85e36SJonas Bonn * and the problem, and then passes it off to one of the appropriate 3861e85e36SJonas Bonn * routines. 3961e85e36SJonas Bonn * 4061e85e36SJonas Bonn * If this routine detects a bad access, it returns 1, otherwise it 4161e85e36SJonas Bonn * returns 0. 4261e85e36SJonas Bonn */ 4361e85e36SJonas Bonn 4461e85e36SJonas Bonn asmlinkage void do_page_fault(struct pt_regs *regs, unsigned long address, 4561e85e36SJonas Bonn unsigned long vector, int write_acc) 4661e85e36SJonas Bonn { 4761e85e36SJonas Bonn struct task_struct *tsk; 4861e85e36SJonas Bonn struct mm_struct *mm; 4961e85e36SJonas Bonn struct vm_area_struct *vma; 5075bfb9a1SEric W. Biederman int si_code; 5150a7ca3cSSouptick Joarder vm_fault_t fault; 52dde16072SPeter Xu unsigned int flags = FAULT_FLAG_DEFAULT; 5361e85e36SJonas Bonn 5461e85e36SJonas Bonn tsk = current; 5561e85e36SJonas Bonn 5661e85e36SJonas Bonn /* 5761e85e36SJonas Bonn * We fault-in kernel-space virtual memory on-demand. The 5861e85e36SJonas Bonn * 'reference' page table is init_mm.pgd. 5961e85e36SJonas Bonn * 6061e85e36SJonas Bonn * NOTE! We MUST NOT take any locks for this case. We may 6161e85e36SJonas Bonn * be in an interrupt or a critical region, and should 6261e85e36SJonas Bonn * only copy the information from the master page table, 6361e85e36SJonas Bonn * nothing more. 6461e85e36SJonas Bonn * 6561e85e36SJonas Bonn * NOTE2: This is done so that, when updating the vmalloc 6661e85e36SJonas Bonn * mappings we don't have to walk all processes pgdirs and 6761e85e36SJonas Bonn * add the high mappings all at once. Instead we do it as they 6861e85e36SJonas Bonn * are used. However vmalloc'ed page entries have the PAGE_GLOBAL 6961e85e36SJonas Bonn * bit set so sometimes the TLB can use a lingering entry. 7061e85e36SJonas Bonn * 7161e85e36SJonas Bonn * This verifies that the fault happens in kernel space 7261e85e36SJonas Bonn * and that the fault was not a protection error. 7361e85e36SJonas Bonn */ 7461e85e36SJonas Bonn 7561e85e36SJonas Bonn if (address >= VMALLOC_START && 7661e85e36SJonas Bonn (vector != 0x300 && vector != 0x400) && 7761e85e36SJonas Bonn !user_mode(regs)) 7861e85e36SJonas Bonn goto vmalloc_fault; 7961e85e36SJonas Bonn 8061e85e36SJonas Bonn /* If exceptions were enabled, we can reenable them here */ 8161e85e36SJonas Bonn if (user_mode(regs)) { 8261e85e36SJonas Bonn /* Exception was in userspace: reenable interrupts */ 8361e85e36SJonas Bonn local_irq_enable(); 84759496baSJohannes Weiner flags |= FAULT_FLAG_USER; 8561e85e36SJonas Bonn } else { 8661e85e36SJonas Bonn /* If exception was in a syscall, then IRQ's may have 8761e85e36SJonas Bonn * been enabled or disabled. If they were enabled, 8861e85e36SJonas Bonn * reenable them. 8961e85e36SJonas Bonn */ 9061e85e36SJonas Bonn if (regs->sr && (SPR_SR_IEE | SPR_SR_TEE)) 9161e85e36SJonas Bonn local_irq_enable(); 9261e85e36SJonas Bonn } 9361e85e36SJonas Bonn 9461e85e36SJonas Bonn mm = tsk->mm; 9575bfb9a1SEric W. Biederman si_code = SEGV_MAPERR; 9661e85e36SJonas Bonn 9761e85e36SJonas Bonn /* 9861e85e36SJonas Bonn * If we're in an interrupt or have no user 9961e85e36SJonas Bonn * context, we must not take the fault.. 10061e85e36SJonas Bonn */ 10161e85e36SJonas Bonn 10261e85e36SJonas Bonn if (in_interrupt() || !mm) 10361e85e36SJonas Bonn goto no_context; 10461e85e36SJonas Bonn 10538caa902SPeter Xu perf_sw_event(PERF_COUNT_SW_PAGE_FAULTS, 1, regs, address); 10638caa902SPeter Xu 1074971f2bdSKautuk Consul retry: 108d8ed45c5SMichel Lespinasse mmap_read_lock(mm); 10961e85e36SJonas Bonn vma = find_vma(mm, address); 11061e85e36SJonas Bonn 11161e85e36SJonas Bonn if (!vma) 11261e85e36SJonas Bonn goto bad_area; 11361e85e36SJonas Bonn 11461e85e36SJonas Bonn if (vma->vm_start <= address) 11561e85e36SJonas Bonn goto good_area; 11661e85e36SJonas Bonn 11761e85e36SJonas Bonn if (!(vma->vm_flags & VM_GROWSDOWN)) 11861e85e36SJonas Bonn goto bad_area; 11961e85e36SJonas Bonn 12061e85e36SJonas Bonn if (user_mode(regs)) { 12161e85e36SJonas Bonn /* 12261e85e36SJonas Bonn * accessing the stack below usp is always a bug. 12361e85e36SJonas Bonn * we get page-aligned addresses so we can only check 12461e85e36SJonas Bonn * if we're within a page from usp, but that might be 12561e85e36SJonas Bonn * enough to catch brutal errors at least. 12661e85e36SJonas Bonn */ 12761e85e36SJonas Bonn if (address + PAGE_SIZE < regs->sp) 12861e85e36SJonas Bonn goto bad_area; 12961e85e36SJonas Bonn } 13061e85e36SJonas Bonn if (expand_stack(vma, address)) 13161e85e36SJonas Bonn goto bad_area; 13261e85e36SJonas Bonn 13361e85e36SJonas Bonn /* 13461e85e36SJonas Bonn * Ok, we have a good vm_area for this memory access, so 13561e85e36SJonas Bonn * we can handle it.. 13661e85e36SJonas Bonn */ 13761e85e36SJonas Bonn 13861e85e36SJonas Bonn good_area: 13975bfb9a1SEric W. Biederman si_code = SEGV_ACCERR; 14061e85e36SJonas Bonn 14161e85e36SJonas Bonn /* first do some preliminary protection checks */ 14261e85e36SJonas Bonn 14361e85e36SJonas Bonn if (write_acc) { 14461e85e36SJonas Bonn if (!(vma->vm_flags & VM_WRITE)) 14561e85e36SJonas Bonn goto bad_area; 1464971f2bdSKautuk Consul flags |= FAULT_FLAG_WRITE; 14761e85e36SJonas Bonn } else { 14861e85e36SJonas Bonn /* not present */ 14961e85e36SJonas Bonn if (!(vma->vm_flags & (VM_READ | VM_EXEC))) 15061e85e36SJonas Bonn goto bad_area; 15161e85e36SJonas Bonn } 15261e85e36SJonas Bonn 15361e85e36SJonas Bonn /* are we trying to execute nonexecutable area */ 15461e85e36SJonas Bonn if ((vector == 0x400) && !(vma->vm_page_prot.pgprot & _PAGE_EXEC)) 15561e85e36SJonas Bonn goto bad_area; 15661e85e36SJonas Bonn 15761e85e36SJonas Bonn /* 15861e85e36SJonas Bonn * If for any reason at all we couldn't handle the fault, 15961e85e36SJonas Bonn * make sure we exit gracefully rather than endlessly redo 16061e85e36SJonas Bonn * the fault. 16161e85e36SJonas Bonn */ 16261e85e36SJonas Bonn 16338caa902SPeter Xu fault = handle_mm_fault(vma, address, flags, regs); 1644971f2bdSKautuk Consul 1654ef87322SPeter Xu if (fault_signal_pending(fault, regs)) 1664971f2bdSKautuk Consul return; 1674971f2bdSKautuk Consul 16861e85e36SJonas Bonn if (unlikely(fault & VM_FAULT_ERROR)) { 16961e85e36SJonas Bonn if (fault & VM_FAULT_OOM) 17061e85e36SJonas Bonn goto out_of_memory; 17133692f27SLinus Torvalds else if (fault & VM_FAULT_SIGSEGV) 17233692f27SLinus Torvalds goto bad_area; 17361e85e36SJonas Bonn else if (fault & VM_FAULT_SIGBUS) 17461e85e36SJonas Bonn goto do_sigbus; 17561e85e36SJonas Bonn BUG(); 17661e85e36SJonas Bonn } 1774971f2bdSKautuk Consul 17861e85e36SJonas Bonn /*RGD modeled on Cris */ 1794971f2bdSKautuk Consul if (fault & VM_FAULT_RETRY) { 18045cac65bSShaohua Li flags |= FAULT_FLAG_TRIED; 1814971f2bdSKautuk Consul 1823e4e28c5SMichel Lespinasse /* No need to mmap_read_unlock(mm) as we would 1834971f2bdSKautuk Consul * have already released it in __lock_page_or_retry 1844971f2bdSKautuk Consul * in mm/filemap.c. 1854971f2bdSKautuk Consul */ 1864971f2bdSKautuk Consul 1874971f2bdSKautuk Consul goto retry; 1884971f2bdSKautuk Consul } 18961e85e36SJonas Bonn 190d8ed45c5SMichel Lespinasse mmap_read_unlock(mm); 19161e85e36SJonas Bonn return; 19261e85e36SJonas Bonn 19361e85e36SJonas Bonn /* 19461e85e36SJonas Bonn * Something tried to access memory that isn't in our memory map.. 19561e85e36SJonas Bonn * Fix it, but check if it's kernel or user first.. 19661e85e36SJonas Bonn */ 19761e85e36SJonas Bonn 19861e85e36SJonas Bonn bad_area: 199d8ed45c5SMichel Lespinasse mmap_read_unlock(mm); 20061e85e36SJonas Bonn 20161e85e36SJonas Bonn bad_area_nosemaphore: 20261e85e36SJonas Bonn 20361e85e36SJonas Bonn /* User mode accesses just cause a SIGSEGV */ 20461e85e36SJonas Bonn 20561e85e36SJonas Bonn if (user_mode(regs)) { 2062e1661d2SEric W. Biederman force_sig_fault(SIGSEGV, si_code, (void __user *)address); 20761e85e36SJonas Bonn return; 20861e85e36SJonas Bonn } 20961e85e36SJonas Bonn 21061e85e36SJonas Bonn no_context: 21161e85e36SJonas Bonn 21261e85e36SJonas Bonn /* Are we prepared to handle this kernel fault? 21361e85e36SJonas Bonn * 21461e85e36SJonas Bonn * (The kernel has valid exception-points in the source 21561e85e36SJonas Bonn * when it acesses user-memory. When it fails in one 21661e85e36SJonas Bonn * of those points, we find it in a table and do a jump 21761e85e36SJonas Bonn * to some fixup code that loads an appropriate error 21861e85e36SJonas Bonn * code) 21961e85e36SJonas Bonn */ 22061e85e36SJonas Bonn 22161e85e36SJonas Bonn { 22261e85e36SJonas Bonn const struct exception_table_entry *entry; 22361e85e36SJonas Bonn 22461e85e36SJonas Bonn if ((entry = search_exception_tables(regs->pc)) != NULL) { 22561e85e36SJonas Bonn /* Adjust the instruction pointer in the stackframe */ 22661e85e36SJonas Bonn regs->pc = entry->fixup; 22761e85e36SJonas Bonn return; 22861e85e36SJonas Bonn } 22961e85e36SJonas Bonn } 23061e85e36SJonas Bonn 23161e85e36SJonas Bonn /* 23261e85e36SJonas Bonn * Oops. The kernel tried to access some bad page. We'll have to 23361e85e36SJonas Bonn * terminate things with extreme prejudice. 23461e85e36SJonas Bonn */ 23561e85e36SJonas Bonn 23661e85e36SJonas Bonn if ((unsigned long)(address) < PAGE_SIZE) 23761e85e36SJonas Bonn printk(KERN_ALERT 23861e85e36SJonas Bonn "Unable to handle kernel NULL pointer dereference"); 23961e85e36SJonas Bonn else 24061e85e36SJonas Bonn printk(KERN_ALERT "Unable to handle kernel access"); 24161e85e36SJonas Bonn printk(" at virtual address 0x%08lx\n", address); 24261e85e36SJonas Bonn 24361e85e36SJonas Bonn die("Oops", regs, write_acc); 24461e85e36SJonas Bonn 24561e85e36SJonas Bonn /* 24661e85e36SJonas Bonn * We ran out of memory, or some other thing happened to us that made 24761e85e36SJonas Bonn * us unable to handle the page fault gracefully. 24861e85e36SJonas Bonn */ 24961e85e36SJonas Bonn 25061e85e36SJonas Bonn out_of_memory: 251d8ed45c5SMichel Lespinasse mmap_read_unlock(mm); 252609838cfSJohannes Weiner if (!user_mode(regs)) 25361e85e36SJonas Bonn goto no_context; 254609838cfSJohannes Weiner pagefault_out_of_memory(); 255609838cfSJohannes Weiner return; 25661e85e36SJonas Bonn 25761e85e36SJonas Bonn do_sigbus: 258d8ed45c5SMichel Lespinasse mmap_read_unlock(mm); 25961e85e36SJonas Bonn 26061e85e36SJonas Bonn /* 26161e85e36SJonas Bonn * Send a sigbus, regardless of whether we were in kernel 26261e85e36SJonas Bonn * or user mode. 26361e85e36SJonas Bonn */ 2642e1661d2SEric W. Biederman force_sig_fault(SIGBUS, BUS_ADRERR, (void __user *)address); 26561e85e36SJonas Bonn 26661e85e36SJonas Bonn /* Kernel mode? Handle exceptions or die */ 26761e85e36SJonas Bonn if (!user_mode(regs)) 26861e85e36SJonas Bonn goto no_context; 26961e85e36SJonas Bonn return; 27061e85e36SJonas Bonn 27161e85e36SJonas Bonn vmalloc_fault: 27261e85e36SJonas Bonn { 27361e85e36SJonas Bonn /* 27461e85e36SJonas Bonn * Synchronize this task's top level page-table 27561e85e36SJonas Bonn * with the 'reference' page table. 27661e85e36SJonas Bonn * 27761e85e36SJonas Bonn * Use current_pgd instead of tsk->active_mm->pgd 27861e85e36SJonas Bonn * since the latter might be unavailable if this 27961e85e36SJonas Bonn * code is executed in a misfortunately run irq 28061e85e36SJonas Bonn * (like inside schedule() between switch_mm and 28161e85e36SJonas Bonn * switch_to...). 28261e85e36SJonas Bonn */ 28361e85e36SJonas Bonn 28461e85e36SJonas Bonn int offset = pgd_index(address); 28561e85e36SJonas Bonn pgd_t *pgd, *pgd_k; 286b187fb7fSMike Rapoport p4d_t *p4d, *p4d_k; 28761e85e36SJonas Bonn pud_t *pud, *pud_k; 28861e85e36SJonas Bonn pmd_t *pmd, *pmd_k; 28961e85e36SJonas Bonn pte_t *pte_k; 29061e85e36SJonas Bonn 29161e85e36SJonas Bonn /* 29261e85e36SJonas Bonn phx_warn("do_page_fault(): vmalloc_fault will not work, " 29361e85e36SJonas Bonn "since current_pgd assign a proper value somewhere\n" 29461e85e36SJonas Bonn "anyhow we don't need this at the moment\n"); 29561e85e36SJonas Bonn 29661e85e36SJonas Bonn phx_mmu("vmalloc_fault"); 29761e85e36SJonas Bonn */ 2988e6d08e0SStefan Kristiansson pgd = (pgd_t *)current_pgd[smp_processor_id()] + offset; 29961e85e36SJonas Bonn pgd_k = init_mm.pgd + offset; 30061e85e36SJonas Bonn 30161e85e36SJonas Bonn /* Since we're two-level, we don't need to do both 30261e85e36SJonas Bonn * set_pgd and set_pmd (they do the same thing). If 30361e85e36SJonas Bonn * we go three-level at some point, do the right thing 30461e85e36SJonas Bonn * with pgd_present and set_pgd here. 30561e85e36SJonas Bonn * 30661e85e36SJonas Bonn * Also, since the vmalloc area is global, we don't 30761e85e36SJonas Bonn * need to copy individual PTE's, it is enough to 30861e85e36SJonas Bonn * copy the pgd pointer into the pte page of the 30961e85e36SJonas Bonn * root task. If that is there, we'll find our pte if 31061e85e36SJonas Bonn * it exists. 31161e85e36SJonas Bonn */ 31261e85e36SJonas Bonn 313b187fb7fSMike Rapoport p4d = p4d_offset(pgd, address); 314b187fb7fSMike Rapoport p4d_k = p4d_offset(pgd_k, address); 315b187fb7fSMike Rapoport if (!p4d_present(*p4d_k)) 316b187fb7fSMike Rapoport goto no_context; 317b187fb7fSMike Rapoport 318b187fb7fSMike Rapoport pud = pud_offset(p4d, address); 319b187fb7fSMike Rapoport pud_k = pud_offset(p4d_k, address); 32061e85e36SJonas Bonn if (!pud_present(*pud_k)) 32161e85e36SJonas Bonn goto no_context; 32261e85e36SJonas Bonn 32361e85e36SJonas Bonn pmd = pmd_offset(pud, address); 32461e85e36SJonas Bonn pmd_k = pmd_offset(pud_k, address); 32561e85e36SJonas Bonn 32661e85e36SJonas Bonn if (!pmd_present(*pmd_k)) 32761e85e36SJonas Bonn goto bad_area_nosemaphore; 32861e85e36SJonas Bonn 32961e85e36SJonas Bonn set_pmd(pmd, *pmd_k); 33061e85e36SJonas Bonn 33161e85e36SJonas Bonn /* Make sure the actual PTE exists as well to 33261e85e36SJonas Bonn * catch kernel vmalloc-area accesses to non-mapped 33361e85e36SJonas Bonn * addresses. If we don't do this, this will just 33461e85e36SJonas Bonn * silently loop forever. 33561e85e36SJonas Bonn */ 33661e85e36SJonas Bonn 33761e85e36SJonas Bonn pte_k = pte_offset_kernel(pmd_k, address); 33861e85e36SJonas Bonn if (!pte_present(*pte_k)) 33961e85e36SJonas Bonn goto no_context; 34061e85e36SJonas Bonn 34161e85e36SJonas Bonn return; 34261e85e36SJonas Bonn } 34361e85e36SJonas Bonn } 344