xref: /openbmc/linux/lib/lzo/lzo1x_compress.c (revision 33fb626be08f3877b92e3c1782eac1a9a1575ea5)
109c434b8SThomas Gleixner // SPDX-License-Identifier: GPL-2.0-only
264c70b1cSRichard Purdie /*
38b975bd3SMarkus F.X.J. Oberhumer  *  LZO1X Compressor from LZO
464c70b1cSRichard Purdie  *
58b975bd3SMarkus F.X.J. Oberhumer  *  Copyright (C) 1996-2012 Markus F.X.J. Oberhumer <markus@oberhumer.com>
664c70b1cSRichard Purdie  *
764c70b1cSRichard Purdie  *  The full LZO package can be found at:
864c70b1cSRichard Purdie  *  http://www.oberhumer.com/opensource/lzo/
964c70b1cSRichard Purdie  *
108b975bd3SMarkus F.X.J. Oberhumer  *  Changed for Linux kernel use by:
1164c70b1cSRichard Purdie  *  Nitin Gupta <nitingupta910@gmail.com>
1264c70b1cSRichard Purdie  *  Richard Purdie <rpurdie@openedhand.com>
1364c70b1cSRichard Purdie  */
1464c70b1cSRichard Purdie 
1564c70b1cSRichard Purdie #include <linux/module.h>
1664c70b1cSRichard Purdie #include <linux/kernel.h>
1764c70b1cSRichard Purdie #include <asm/unaligned.h>
188b975bd3SMarkus F.X.J. Oberhumer #include <linux/lzo.h>
1964c70b1cSRichard Purdie #include "lzodefs.h"
2064c70b1cSRichard Purdie 
2164c70b1cSRichard Purdie static noinline size_t
228b975bd3SMarkus F.X.J. Oberhumer lzo1x_1_do_compress(const unsigned char *in, size_t in_len,
238b975bd3SMarkus F.X.J. Oberhumer 		    unsigned char *out, size_t *out_len,
2445ec975eSDave Rodgman 		    size_t ti, void *wrkmem, signed char *state_offset,
2545ec975eSDave Rodgman 		    const unsigned char bitstream_version)
2664c70b1cSRichard Purdie {
278b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip;
288b975bd3SMarkus F.X.J. Oberhumer 	unsigned char *op;
2964c70b1cSRichard Purdie 	const unsigned char * const in_end = in + in_len;
308b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char * const ip_end = in + in_len - 20;
318b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ii;
328b975bd3SMarkus F.X.J. Oberhumer 	lzo_dict_t * const dict = (lzo_dict_t *) wrkmem;
3364c70b1cSRichard Purdie 
348b975bd3SMarkus F.X.J. Oberhumer 	op = out;
358b975bd3SMarkus F.X.J. Oberhumer 	ip = in;
368b975bd3SMarkus F.X.J. Oberhumer 	ii = ip;
378b975bd3SMarkus F.X.J. Oberhumer 	ip += ti < 4 ? 4 - ti : 0;
3864c70b1cSRichard Purdie 
3964c70b1cSRichard Purdie 	for (;;) {
405ee4014aSDave Rodgman 		const unsigned char *m_pos = NULL;
418b975bd3SMarkus F.X.J. Oberhumer 		size_t t, m_len, m_off;
428b975bd3SMarkus F.X.J. Oberhumer 		u32 dv;
435ee4014aSDave Rodgman 		u32 run_length = 0;
4464c70b1cSRichard Purdie literal:
458b975bd3SMarkus F.X.J. Oberhumer 		ip += 1 + ((ip - ii) >> 5);
468b975bd3SMarkus F.X.J. Oberhumer next:
4764c70b1cSRichard Purdie 		if (unlikely(ip >= ip_end))
4864c70b1cSRichard Purdie 			break;
498b975bd3SMarkus F.X.J. Oberhumer 		dv = get_unaligned_le32(ip);
505ee4014aSDave Rodgman 
5145ec975eSDave Rodgman 		if (dv == 0 && bitstream_version) {
525ee4014aSDave Rodgman 			const unsigned char *ir = ip + 4;
535ee4014aSDave Rodgman 			const unsigned char *limit = ip_end
545ee4014aSDave Rodgman 				< (ip + MAX_ZERO_RUN_LENGTH + 1)
555ee4014aSDave Rodgman 				? ip_end : ip + MAX_ZERO_RUN_LENGTH + 1;
565ee4014aSDave Rodgman #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && \
575ee4014aSDave Rodgman 	defined(LZO_FAST_64BIT_MEMORY_ACCESS)
585ee4014aSDave Rodgman 			u64 dv64;
595ee4014aSDave Rodgman 
605ee4014aSDave Rodgman 			for (; (ir + 32) <= limit; ir += 32) {
615ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
625ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 1);
635ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 2);
645ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 3);
655ee4014aSDave Rodgman 				if (dv64)
665ee4014aSDave Rodgman 					break;
675ee4014aSDave Rodgman 			}
685ee4014aSDave Rodgman 			for (; (ir + 8) <= limit; ir += 8) {
695ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
705ee4014aSDave Rodgman 				if (dv64) {
715ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
725ee4014aSDave Rodgman 					ir += __builtin_ctzll(dv64) >> 3;
735ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
745ee4014aSDave Rodgman 					ir += __builtin_clzll(dv64) >> 3;
755ee4014aSDave Rodgman #  else
765ee4014aSDave Rodgman #    error "missing endian definition"
775ee4014aSDave Rodgman #  endif
785ee4014aSDave Rodgman 					break;
795ee4014aSDave Rodgman 				}
805ee4014aSDave Rodgman 			}
815ee4014aSDave Rodgman #else
825ee4014aSDave Rodgman 			while ((ir < (const unsigned char *)
835ee4014aSDave Rodgman 					ALIGN((uintptr_t)ir, 4)) &&
845ee4014aSDave Rodgman 					(ir < limit) && (*ir == 0))
855ee4014aSDave Rodgman 				ir++;
8609b35b41SDave Rodgman 			if (IS_ALIGNED((uintptr_t)ir, 4)) {
875ee4014aSDave Rodgman 				for (; (ir + 4) <= limit; ir += 4) {
885ee4014aSDave Rodgman 					dv = *((u32 *)ir);
895ee4014aSDave Rodgman 					if (dv) {
905ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
915ee4014aSDave Rodgman 						ir += __builtin_ctz(dv) >> 3;
925ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
935ee4014aSDave Rodgman 						ir += __builtin_clz(dv) >> 3;
945ee4014aSDave Rodgman #  else
955ee4014aSDave Rodgman #    error "missing endian definition"
965ee4014aSDave Rodgman #  endif
975ee4014aSDave Rodgman 						break;
985ee4014aSDave Rodgman 					}
995ee4014aSDave Rodgman 				}
10009b35b41SDave Rodgman 			}
1015ee4014aSDave Rodgman #endif
1025ee4014aSDave Rodgman 			while (likely(ir < limit) && unlikely(*ir == 0))
1035ee4014aSDave Rodgman 				ir++;
1045ee4014aSDave Rodgman 			run_length = ir - ip;
1055ee4014aSDave Rodgman 			if (run_length > MAX_ZERO_RUN_LENGTH)
1065ee4014aSDave Rodgman 				run_length = MAX_ZERO_RUN_LENGTH;
1075ee4014aSDave Rodgman 		} else {
1088b975bd3SMarkus F.X.J. Oberhumer 			t = ((dv * 0x1824429d) >> (32 - D_BITS)) & D_MASK;
1098b975bd3SMarkus F.X.J. Oberhumer 			m_pos = in + dict[t];
1108b975bd3SMarkus F.X.J. Oberhumer 			dict[t] = (lzo_dict_t) (ip - in);
1118b975bd3SMarkus F.X.J. Oberhumer 			if (unlikely(dv != get_unaligned_le32(m_pos)))
1128b975bd3SMarkus F.X.J. Oberhumer 				goto literal;
1135ee4014aSDave Rodgman 		}
11464c70b1cSRichard Purdie 
1158b975bd3SMarkus F.X.J. Oberhumer 		ii -= ti;
1168b975bd3SMarkus F.X.J. Oberhumer 		ti = 0;
1178b975bd3SMarkus F.X.J. Oberhumer 		t = ip - ii;
1188b975bd3SMarkus F.X.J. Oberhumer 		if (t != 0) {
11964c70b1cSRichard Purdie 			if (t <= 3) {
1205ee4014aSDave Rodgman 				op[*state_offset] |= t;
1218b975bd3SMarkus F.X.J. Oberhumer 				COPY4(op, ii);
1228b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1238b975bd3SMarkus F.X.J. Oberhumer 			} else if (t <= 16) {
1248b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (t - 3);
1258b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op, ii);
1268b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op + 8, ii + 8);
1278b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1288b975bd3SMarkus F.X.J. Oberhumer 			} else {
1298b975bd3SMarkus F.X.J. Oberhumer 				if (t <= 18) {
13064c70b1cSRichard Purdie 					*op++ = (t - 3);
13164c70b1cSRichard Purdie 				} else {
13264c70b1cSRichard Purdie 					size_t tt = t - 18;
13364c70b1cSRichard Purdie 					*op++ = 0;
1348b975bd3SMarkus F.X.J. Oberhumer 					while (unlikely(tt > 255)) {
13564c70b1cSRichard Purdie 						tt -= 255;
13664c70b1cSRichard Purdie 						*op++ = 0;
13764c70b1cSRichard Purdie 					}
13864c70b1cSRichard Purdie 					*op++ = tt;
13964c70b1cSRichard Purdie 				}
14064c70b1cSRichard Purdie 				do {
1418b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op, ii);
1428b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op + 8, ii + 8);
1438b975bd3SMarkus F.X.J. Oberhumer 					op += 16;
1448b975bd3SMarkus F.X.J. Oberhumer 					ii += 16;
1458b975bd3SMarkus F.X.J. Oberhumer 					t -= 16;
1468b975bd3SMarkus F.X.J. Oberhumer 				} while (t >= 16);
1478b975bd3SMarkus F.X.J. Oberhumer 				if (t > 0) do {
14864c70b1cSRichard Purdie 					*op++ = *ii++;
14964c70b1cSRichard Purdie 				} while (--t > 0);
15064c70b1cSRichard Purdie 			}
1518b975bd3SMarkus F.X.J. Oberhumer 		}
15264c70b1cSRichard Purdie 
1535ee4014aSDave Rodgman 		if (unlikely(run_length)) {
1545ee4014aSDave Rodgman 			ip += run_length;
1555ee4014aSDave Rodgman 			run_length -= MIN_ZERO_RUN_LENGTH;
1565ee4014aSDave Rodgman 			put_unaligned_le32((run_length << 21) | 0xfffc18
1575ee4014aSDave Rodgman 					   | (run_length & 0x7), op);
1585ee4014aSDave Rodgman 			op += 4;
1595ee4014aSDave Rodgman 			run_length = 0;
1605ee4014aSDave Rodgman 			*state_offset = -3;
1615ee4014aSDave Rodgman 			goto finished_writing_instruction;
1625ee4014aSDave Rodgman 		}
1635ee4014aSDave Rodgman 
1648b975bd3SMarkus F.X.J. Oberhumer 		m_len = 4;
1658b975bd3SMarkus F.X.J. Oberhumer 		{
1668b975bd3SMarkus F.X.J. Oberhumer #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ64)
1678b975bd3SMarkus F.X.J. Oberhumer 		u64 v;
1688b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u64 *) (ip + m_len)) ^
1698b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u64 *) (m_pos + m_len));
1708b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1718b975bd3SMarkus F.X.J. Oberhumer 			do {
1728b975bd3SMarkus F.X.J. Oberhumer 				m_len += 8;
1738b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u64 *) (ip + m_len)) ^
1748b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u64 *) (m_pos + m_len));
1758b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1768b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1778b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
1788b975bd3SMarkus F.X.J. Oberhumer 		}
1798b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
1808b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctzll(v) / 8;
1818b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
1828b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clzll(v) / 8;
1838b975bd3SMarkus F.X.J. Oberhumer #  else
1848b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
1858b975bd3SMarkus F.X.J. Oberhumer #  endif
1868b975bd3SMarkus F.X.J. Oberhumer #elif defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ32)
1878b975bd3SMarkus F.X.J. Oberhumer 		u32 v;
1888b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u32 *) (ip + m_len)) ^
1898b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u32 *) (m_pos + m_len));
1908b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1918b975bd3SMarkus F.X.J. Oberhumer 			do {
1928b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1938b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1948b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1958b975bd3SMarkus F.X.J. Oberhumer 				if (v != 0)
1968b975bd3SMarkus F.X.J. Oberhumer 					break;
1978b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1988b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1998b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
2008b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
2018b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2028b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
2038b975bd3SMarkus F.X.J. Oberhumer 		}
2048b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
2058b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctz(v) / 8;
2068b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
2078b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clz(v) / 8;
2088b975bd3SMarkus F.X.J. Oberhumer #  else
2098b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
2108b975bd3SMarkus F.X.J. Oberhumer #  endif
2118b975bd3SMarkus F.X.J. Oberhumer #else
2128b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(ip[m_len] == m_pos[m_len])) {
2138b975bd3SMarkus F.X.J. Oberhumer 			do {
2148b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2158b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2168b975bd3SMarkus F.X.J. Oberhumer 					break;
2178b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2188b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2198b975bd3SMarkus F.X.J. Oberhumer 					break;
2208b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2218b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2228b975bd3SMarkus F.X.J. Oberhumer 					break;
2238b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2248b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2258b975bd3SMarkus F.X.J. Oberhumer 					break;
2268b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2278b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2288b975bd3SMarkus F.X.J. Oberhumer 					break;
2298b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2308b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2318b975bd3SMarkus F.X.J. Oberhumer 					break;
2328b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2338b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2348b975bd3SMarkus F.X.J. Oberhumer 					break;
2358b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2368b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
2378b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2388b975bd3SMarkus F.X.J. Oberhumer 			} while (ip[m_len] == m_pos[m_len]);
2398b975bd3SMarkus F.X.J. Oberhumer 		}
2408b975bd3SMarkus F.X.J. Oberhumer #endif
2418b975bd3SMarkus F.X.J. Oberhumer 		}
2428b975bd3SMarkus F.X.J. Oberhumer m_len_done:
24364c70b1cSRichard Purdie 
2448b975bd3SMarkus F.X.J. Oberhumer 		m_off = ip - m_pos;
2458b975bd3SMarkus F.X.J. Oberhumer 		ip += m_len;
2468b975bd3SMarkus F.X.J. Oberhumer 		if (m_len <= M2_MAX_LEN && m_off <= M2_MAX_OFFSET) {
24764c70b1cSRichard Purdie 			m_off -= 1;
2488b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (((m_len - 1) << 5) | ((m_off & 7) << 2));
24964c70b1cSRichard Purdie 			*op++ = (m_off >> 3);
25064c70b1cSRichard Purdie 		} else if (m_off <= M3_MAX_OFFSET) {
25164c70b1cSRichard Purdie 			m_off -= 1;
2528b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M3_MAX_LEN)
25364c70b1cSRichard Purdie 				*op++ = (M3_MARKER | (m_len - 2));
2548b975bd3SMarkus F.X.J. Oberhumer 			else {
2558b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M3_MAX_LEN;
25664c70b1cSRichard Purdie 				*op++ = M3_MARKER | 0;
2578b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
25864c70b1cSRichard Purdie 					m_len -= 255;
25964c70b1cSRichard Purdie 					*op++ = 0;
26064c70b1cSRichard Purdie 				}
26164c70b1cSRichard Purdie 				*op++ = (m_len);
26264c70b1cSRichard Purdie 			}
2638b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
2648b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off >> 6);
2658b975bd3SMarkus F.X.J. Oberhumer 		} else {
2668b975bd3SMarkus F.X.J. Oberhumer 			m_off -= 0x4000;
2678b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M4_MAX_LEN)
2688b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8)
2698b975bd3SMarkus F.X.J. Oberhumer 						| (m_len - 2));
2708b975bd3SMarkus F.X.J. Oberhumer 			else {
271b5265c81SDave Rodgman 				if (unlikely(((m_off & 0x403f) == 0x403f)
272b5265c81SDave Rodgman 						&& (m_len >= 261)
273b5265c81SDave Rodgman 						&& (m_len <= 264))
274b5265c81SDave Rodgman 						&& likely(bitstream_version)) {
275b5265c81SDave Rodgman 					// Under lzo-rle, block copies
276b5265c81SDave Rodgman 					// for 261 <= length <= 264 and
277b5265c81SDave Rodgman 					// (distance & 0x80f3) == 0x80f3
278b5265c81SDave Rodgman 					// can result in ambiguous
279b5265c81SDave Rodgman 					// output. Adjust length
280b5265c81SDave Rodgman 					// to 260 to prevent ambiguity.
281b5265c81SDave Rodgman 					ip -= m_len - 260;
282b5265c81SDave Rodgman 					m_len = 260;
283b5265c81SDave Rodgman 				}
2848b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M4_MAX_LEN;
2858b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8));
2868b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
2878b975bd3SMarkus F.X.J. Oberhumer 					m_len -= 255;
2888b975bd3SMarkus F.X.J. Oberhumer 					*op++ = 0;
28964c70b1cSRichard Purdie 				}
2908b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (m_len);
2918b975bd3SMarkus F.X.J. Oberhumer 			}
2928b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
29364c70b1cSRichard Purdie 			*op++ = (m_off >> 6);
29464c70b1cSRichard Purdie 		}
2955ee4014aSDave Rodgman 		*state_offset = -2;
2965ee4014aSDave Rodgman finished_writing_instruction:
2975ee4014aSDave Rodgman 		ii = ip;
2988b975bd3SMarkus F.X.J. Oberhumer 		goto next;
29964c70b1cSRichard Purdie 	}
30064c70b1cSRichard Purdie 	*out_len = op - out;
3018b975bd3SMarkus F.X.J. Oberhumer 	return in_end - (ii - ti);
30264c70b1cSRichard Purdie }
30364c70b1cSRichard Purdie 
304*33fb626bSJason Yan static int lzogeneric1x_1_compress(const unsigned char *in, size_t in_len,
3058b975bd3SMarkus F.X.J. Oberhumer 		     unsigned char *out, size_t *out_len,
30645ec975eSDave Rodgman 		     void *wrkmem, const unsigned char bitstream_version)
30764c70b1cSRichard Purdie {
3088b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip = in;
30964c70b1cSRichard Purdie 	unsigned char *op = out;
310b11ed18eSDave Rodgman 	unsigned char *data_start;
3118b975bd3SMarkus F.X.J. Oberhumer 	size_t l = in_len;
3128b975bd3SMarkus F.X.J. Oberhumer 	size_t t = 0;
3135ee4014aSDave Rodgman 	signed char state_offset = -2;
31445ec975eSDave Rodgman 	unsigned int m4_max_offset;
3155ee4014aSDave Rodgman 
316b11ed18eSDave Rodgman 	// LZO v0 will never write 17 as first byte (except for zero-length
317b11ed18eSDave Rodgman 	// input), so this is used to version the bitstream
31845ec975eSDave Rodgman 	if (bitstream_version > 0) {
3195ee4014aSDave Rodgman 		*op++ = 17;
32045ec975eSDave Rodgman 		*op++ = bitstream_version;
32145ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V1;
32245ec975eSDave Rodgman 	} else {
32345ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V0;
32445ec975eSDave Rodgman 	}
32564c70b1cSRichard Purdie 
326b11ed18eSDave Rodgman 	data_start = op;
327b11ed18eSDave Rodgman 
3288b975bd3SMarkus F.X.J. Oberhumer 	while (l > 20) {
32945ec975eSDave Rodgman 		size_t ll = l <= (m4_max_offset + 1) ? l : (m4_max_offset + 1);
3308b975bd3SMarkus F.X.J. Oberhumer 		uintptr_t ll_end = (uintptr_t) ip + ll;
3318b975bd3SMarkus F.X.J. Oberhumer 		if ((ll_end + ((t + ll) >> 5)) <= ll_end)
3328b975bd3SMarkus F.X.J. Oberhumer 			break;
3338b975bd3SMarkus F.X.J. Oberhumer 		BUILD_BUG_ON(D_SIZE * sizeof(lzo_dict_t) > LZO1X_1_MEM_COMPRESS);
3348b975bd3SMarkus F.X.J. Oberhumer 		memset(wrkmem, 0, D_SIZE * sizeof(lzo_dict_t));
33545ec975eSDave Rodgman 		t = lzo1x_1_do_compress(ip, ll, op, out_len, t, wrkmem,
33645ec975eSDave Rodgman 					&state_offset, bitstream_version);
3378b975bd3SMarkus F.X.J. Oberhumer 		ip += ll;
33864c70b1cSRichard Purdie 		op += *out_len;
3398b975bd3SMarkus F.X.J. Oberhumer 		l  -= ll;
34064c70b1cSRichard Purdie 	}
3418b975bd3SMarkus F.X.J. Oberhumer 	t += l;
34264c70b1cSRichard Purdie 
34364c70b1cSRichard Purdie 	if (t > 0) {
3448b975bd3SMarkus F.X.J. Oberhumer 		const unsigned char *ii = in + in_len - t;
34564c70b1cSRichard Purdie 
346b11ed18eSDave Rodgman 		if (op == data_start && t <= 238) {
34764c70b1cSRichard Purdie 			*op++ = (17 + t);
34864c70b1cSRichard Purdie 		} else if (t <= 3) {
3495ee4014aSDave Rodgman 			op[state_offset] |= t;
35064c70b1cSRichard Purdie 		} else if (t <= 18) {
35164c70b1cSRichard Purdie 			*op++ = (t - 3);
35264c70b1cSRichard Purdie 		} else {
35364c70b1cSRichard Purdie 			size_t tt = t - 18;
35464c70b1cSRichard Purdie 			*op++ = 0;
35564c70b1cSRichard Purdie 			while (tt > 255) {
35664c70b1cSRichard Purdie 				tt -= 255;
35764c70b1cSRichard Purdie 				*op++ = 0;
35864c70b1cSRichard Purdie 			}
35964c70b1cSRichard Purdie 			*op++ = tt;
36064c70b1cSRichard Purdie 		}
3618b975bd3SMarkus F.X.J. Oberhumer 		if (t >= 16) do {
3628b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op, ii);
3638b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op + 8, ii + 8);
3648b975bd3SMarkus F.X.J. Oberhumer 			op += 16;
3658b975bd3SMarkus F.X.J. Oberhumer 			ii += 16;
3668b975bd3SMarkus F.X.J. Oberhumer 			t -= 16;
3678b975bd3SMarkus F.X.J. Oberhumer 		} while (t >= 16);
3688b975bd3SMarkus F.X.J. Oberhumer 		if (t > 0) do {
36964c70b1cSRichard Purdie 			*op++ = *ii++;
37064c70b1cSRichard Purdie 		} while (--t > 0);
37164c70b1cSRichard Purdie 	}
37264c70b1cSRichard Purdie 
37364c70b1cSRichard Purdie 	*op++ = M4_MARKER | 1;
37464c70b1cSRichard Purdie 	*op++ = 0;
37564c70b1cSRichard Purdie 	*op++ = 0;
37664c70b1cSRichard Purdie 
37764c70b1cSRichard Purdie 	*out_len = op - out;
37864c70b1cSRichard Purdie 	return LZO_E_OK;
37964c70b1cSRichard Purdie }
38045ec975eSDave Rodgman 
38145ec975eSDave Rodgman int lzo1x_1_compress(const unsigned char *in, size_t in_len,
38245ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
38345ec975eSDave Rodgman 		     void *wrkmem)
38445ec975eSDave Rodgman {
38545ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len, wrkmem, 0);
38645ec975eSDave Rodgman }
38745ec975eSDave Rodgman 
38845ec975eSDave Rodgman int lzorle1x_1_compress(const unsigned char *in, size_t in_len,
38945ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
39045ec975eSDave Rodgman 		     void *wrkmem)
39145ec975eSDave Rodgman {
39245ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len,
39345ec975eSDave Rodgman 				       wrkmem, LZO_VERSION);
39445ec975eSDave Rodgman }
39545ec975eSDave Rodgman 
39664c70b1cSRichard Purdie EXPORT_SYMBOL_GPL(lzo1x_1_compress);
39745ec975eSDave Rodgman EXPORT_SYMBOL_GPL(lzorle1x_1_compress);
39864c70b1cSRichard Purdie 
39964c70b1cSRichard Purdie MODULE_LICENSE("GPL");
40064c70b1cSRichard Purdie MODULE_DESCRIPTION("LZO1X-1 Compressor");
401